Abacus AIが開発した新しいオープンソース言語モデル「Smaug-72B」が、自然言語処理(NLP)の研究とアプリケーションにおける主要プラットフォームであるHugging Faceの最新ランキングで世界最高のモデルとしての地位を獲得しました。Smaug-72Bは、数ヶ月前にAlibaba Groupの研究チームQwenによってリリースされた強力な言語モデル「Qwen-72B」のファインチューニング版です。このモデルは、OpenAIとMistralによって開発された最も進んだオープンソースの大規模言語モデルであるGPT-3.5とMistral Mediumを、複数の主要なベンチマークで上回る性能を示しています。また、元となったQwen-72Bをも大きな差で上回っています。
Hugging Faceのオープンソース言語モデルのパフォーマンスを測定するOpen LLMリーダーボードによると、Smaug-72Bはすべての主要なLLM評価で平均スコアが80以上となり、この分野で初めての成果を達成しました。特に、推論と数学のタスクで優れた性能を発揮しており、これはAbacus AIがファインチューニングプロセスに適用した技術によるものです。これらの技術は、大規模言語モデルの弱点を対象とし、その能力を向上させるもので、近日中に詳細が研究論文で公開される予定です。
Smaug-72Bの登場は、オープンソースAIの急速な進化と、大手テクノロジー企業の支配に挑戦する新たなAIイノベーションと民主化の波を象徴しています。このモデルは、AIの進歩が大企業だけでなく、より広い範囲の創造性を持つ人々によっても形作られるべきであるという考え方を基に、オープンソースAIの可能性を広げるものです。
【ニュース解説】
Abacus AIが開発した新しいオープンソース言語モデル「Smaug-72B」が、自然言語処理(NLP)の分野で世界最高のモデルとして認められました。このモデルは、以前にAlibaba Groupの研究チームQwenによってリリースされた「Qwen-72B」を基に、さらにファインチューニングされたものです。Smaug-72Bは、OpenAIとMistralによって開発された先進的なオープンソースの大規模言語モデル、GPT-3.5とMistral Mediumを含む、複数の主要なベンチマークで上回る性能を示しています。
Hugging FaceのOpen LLMリーダーボードによると、Smaug-72Bはすべての主要なLLM評価で平均スコアが80以上を達成し、この分野で初めての成果を挙げました。特に、推論と数学のタスクで顕著な性能を発揮しており、これはAbacus AIがファインチューニングプロセスに適用した特定の技術によるものです。これらの技術は、大規模言語モデルの弱点を対象とし、その能力を向上させることを目的としています。
Smaug-72Bの登場は、オープンソースAIの分野における重要なマイルストーンです。これまでAIの進歩は、主に大手テクノロジー企業によって牽引されてきましたが、Smaug-72Bのようなオープンソースモデルの成功は、AI技術の発展がより広いコミュニティによっても可能であることを示しています。これにより、AIの研究と開発がより透明でアクセスしやすくなり、多様なアイデアやアプローチが試される機会が増えることが期待されます。
しかし、このようなオープンソースモデルの普及には潜在的なリスクも伴います。例えば、誤った情報の拡散やプライバシーの侵害など、AI技術の悪用につながる可能性があります。そのため、技術の発展と同時に、倫理的なガイドラインや規制の整備も重要な課題となります。
長期的には、Smaug-72BのようなモデルがAI技術の民主化を促進し、教育、医療、環境保護など、さまざまな分野でのイノベーションを加速させる可能性があります。また、オープンソースAIの進化は、大企業による技術の独占を防ぎ、より公平で持続可能な技術進歩を実現するための一歩となるでしょう。
from Meet ‘Smaug-72B’: The new king of open-source AI.