Hon Hai研究所が推論機能を備えた従来の中国語LLMを発表

2025-03-10 20:00

AI研究センターによる最初のバージョンは、数学と推論で優れた性能を発揮しています。

台北、2025年3月11日/PRNewswire/ -- Hon Hai研究所は本日、台湾のAI技術の発展において新たなマイルストーンを打ち立てる、初の繁体字中国語大型言語モデル(LLM)の発表を行いました。このモデルは、より効率的で低コストなモデル訓練方法を用いてわずか4週間で完成しました。

Hon Hai・テクノロジー・グループ(「フォックスコン」)(TWSE:2317)によって支援されているこの研究所は、世界最大の電子機器メーカーであり、主要な技術ソリューションプロバイダーであると述べ、コードネーム「FoxBrain」のLLMは将来的にオープンソース化され、一般に公開される予定であると発表しました。元々、グループの内部システムで使用されるアプリケーション向けに設計されており、データ分析、意思決定支援、ドキュメントコラボレーション、数学、推論と問題解決、コード生成などの機能をカバーしています。

FoxBrainは強力な理解力と推論能力を示すだけでなく、台湾ユーザーの言語スタイルにも最適化されており、数学的および論理的推論テストで優れたパフォーマンスを発揮します。

「最近数ヶ月間、推論能力の深化とGPUの効率的な利用が、AI分野における主流の発展となってきました。私たちのFoxBrainモデルは、計算能力を盲目的に蓄積するのではなく、トレーニングプロセスを最適化することに焦点を当てた非常に効率的なトレーニング戦略を採用しました」と、Hon Hai研究所の人工知能研究センター所長であるリー・ユンフイ博士は述べました。「慎重に設計されたトレーニング方法とリソースの最適化を通じて、強力な推論能力を持つローカルAIモデルを成功裏に構築しました。」

FoxBrainのトレーニングプロセスは、NVIDIA H100 GPUsによって支えられ、NVIDIA Quantum-2 InfiniBandネットワーキングでスケールされ、約4週間で完了しました。最近市場に投入された推論モデルと比較して、より効率的で低コストなモデル訓練方法は、台湾のAI技術の発展に新たなマイルストーンを打ち立てました。

FoxBrainは、70Bパラメータを持つMeta Llama 3.1アーキテクチャに基づいています。TMMLU+テストデータセットのほとんどのカテゴリにおいて、同じスケールのLlama-3-Taiwan-70Bを上回り、特に数学と論理的推論において優れた性能を発揮しています(FoxBrainのTMMLU+ベンチマークについてはFig.1を参照してください)。以下はFoxBrainの技術仕様とトレーニング戦略です。

  • 独自の技術を通じて24のトピックカテゴリのデータ拡張方法と品質評価を確立し、伝統的な中国語の高品質な事前トレーニングデータとして98Bトークンを生成しました。
  • コンテキストウィンドウの長さ: 128Kトークン
  • トレーニングに120台のNVIDIA H100 GPUを使用し、総計2,688 GPU日分の計算コストがかかりました。
  • 高性能と安定性を確保するために、マルチノード並列トレーニングアーキテクチャを採用しました。
  • 独自の適応的推論反射技術を使用して、モデルを自律的推論に訓練しました。

Fig. 1: TMMLU+ benchmark results of FoxBrain, Meta-Llama-3.1-70B and Taiwan-Llama-70B
Fig. 1: TMMLU+ benchmark results of FoxBrain, Meta-Llama-3.1-70B and Taiwan-Llama-70B

テスト結果では、FoxBrainはベースのMeta Llama 3.1モデルと比較して数学において包括的な改善を示しました。台湾Llamaと比較して数学テストで大きな進展を遂げ、現在の最良の伝統的な中国語大規模モデルである台湾Llamaを超え、同じクラスのMetaの現在のモデルを数学的推論能力で上回りました。DeepSeekの蒸留モデルにはまだわずかな差がありますが、その性能はすでに世界のトップレベルに非常に近いです。

FoxBrainの開発は、データ収集、クリーニング、拡張から、継続的事前学習、教師ありファインチューニング、RLAIF、適応推論反映に至るまで、独立した研究を通じて段階的に行われ、限られた計算リソースにもかかわらず、世界クラスのAIモデルに近い利益を達成しました。この大規模言語モデルの研究は、台湾の技術者がAIモデル分野で国際的な競争相手と競えることを示しています。

FoxBrainは当初、グループ内のアプリケーション用に設計されていましたが、今後、グループはテクノロジーパートナーと協力してFoxBrainのアプリケーションを拡大し、オープンソース情報を共有し、製造、サプライチェーン管理、インテリジェントな意思決定におけるAIの普及を促進していく予定です。

モデルのトレーニング中、NVIDIAは台北-1スーパーコンピュータと技術相談を通じてサポートを提供し、Hon Hai Research InstituteがNVIDIA NeMoを使用してモデルの事前トレーニングを成功裏に完了できるようにしました。FoxBrainは、Foxconnの三大プラットフォームのアップグレードを推進する重要なエンジンにもなるでしょう。スマート製造、スマートEV、スマートシティ。

FoxBrainの結果は、NVIDIA GTC 2025セッション「オープンソースからフロンティアAIへ」で初めて主要な会議で共有される予定です。3月20日に「ファウンデーションモデルの構築、カスタマイズ、拡張」

Hon Hai研究所について

その研究所には5つの研究センターがあります。各センターには平均40名のハイテクR&D専門家がおり、全員が新技術の研究開発、フォックスコンの技術と製品の革新パイプラインの強化、グループの「腕力」から「頭脳」への変革を支援する取り組み、フォックスコンの「3+3」戦略の競争力強化に注力しています。

Foxconnについてはこちらをご覧ください。

  1. 米議会上院 イラン攻撃を制限する決議案を可決 与党の一部も賛成 トランプ政権に痛手 決議に拘束力はなし
  2. 「日常生活で使えるポーズを選んだ」“滅ポーズ”の仕掛け人が語る「15秒の勝負」【THE TIME,】
  3. 家に『赤ちゃんが遊びに来た』結果→大型犬が何度も様子を見に行って…『母性が爆発してしまう光景』が24万再生「感動した」「癒ししかない」
  4. 九州北部は線状降水帯発生のおそれ 西から雨の範囲が広がるも北日本は日差しが戻り気温上昇
  5. 生後2ヶ月の子犬と写真撮影→1年後、同じ場所で同じように撮ってみたら…あまりにデカい『衝撃の一枚』に9万いいね「恐るべしw」「バグで草」
  6. 【速報】群馬・高崎市の駐車場で血まみれの10~20代女性見つかる 死亡確認 現場に刃物のようなもの 殺人事件か
  7. 天皇陛下 ベルギーの晩さん会でスピーチ W杯にも触れ エリザベート王女(24)ら初の国賓接遇
  8. トランプ大統領 ホルムズ海峡の石油輸送が「歴史上で最大」になったと主張 イランの核関連施設へのIAEAの査察「適切な時期に実施」
  9. 全身が接着剤まみれの子猫を保護 夫を亡くした女性と出会い、懸命な「オイル・マッサージ」を受けて「幸せな家族」になる 米国
  10. ベッドで横になる『生まれたばかりの赤ちゃん』→2匹の猫が近づいてくると…尊すぎる光景に5万いいね「幸せな気持ちになった」「優しい世界」
  1. 【速報】群馬・高崎市の駐車場で血まみれの10~20代女性見つかる 死亡確認 現場に刃物のようなもの 殺人事件か
  2. 神戸・マンション冷凍庫から“切断”遺体 元妻を死体遺棄容疑で逮捕「私がやったことで間違いありません」
  3. 天皇陛下 ベルギーの晩さん会でスピーチ W杯にも触れ エリザベート王女(24)ら初の国賓接遇
  4. 九州北部は線状降水帯発生のおそれ 西から雨の範囲が広がるも北日本は日差しが戻り気温上昇
  5. トランプ大統領 ホルムズ海峡の石油輸送が「歴史上で最大」になったと主張 イランの核関連施設へのIAEAの査察「適切な時期に実施」
  6. 「日常生活で使えるポーズを選んだ」“滅ポーズ”の仕掛け人が語る「15秒の勝負」【THE TIME,】
  7. 米議会上院 イラン攻撃を制限する決議案を可決 与党の一部も賛成 トランプ政権に痛手 決議に拘束力はなし
  8. 食料品の消費税「来年4月から1%」に引き下げ 国民会議でとりまとめ案提示へ
  9. 東京・北区の小学校火災「校舎の建て替え検討」 当面はクラスや学年が別々の校舎に分かれて授業へ
  10. 41歳C.ロナウド 史上初の6大会連続得点!芸術的先制ゴールに会場は大熱狂、W杯歴代2位となる年長ゴール
  11. 家に『赤ちゃんが遊びに来た』結果→大型犬が何度も様子を見に行って…『母性が爆発してしまう光景』が24万再生「感動した」「癒ししかない」
  12. 神戸マンション冷凍庫”切断”遺体 元妻を死体遺棄容疑で逮捕 2012年頃から庫内に放置か【news23】