さまざまな領域でお互いを超えたいと思うより小さくて大規模なKIが毎日発表されています。ただし、多くの場合、これは特定のベンチマークまたはプログラミングなどのより複雑なタスクでのみ発生します。。
それにもかかわらず、彼のAI会社Xaiの新しい大手言語モデル(LLM)であるElon Musk Grok 3は、世界のシュレートキ
。しかし、この主張の背後にあるものは何ですか?
Grok 3:それはその中にあります
ムスクとXaiの一部の開発者は、XのライブストリームにGrok 3を導入しました。また、ミニバージョンと特別な推論モデルもありました。
推奨される編集コンテンツ
この時点で、Twitterの外部コンテンツがあり、これが記事を補完します。
ワンクリックで表示して再度非表示にすることができます。
Twitterのコンテンツが表示されることに同意します。
個人データは、第3パーティプラットフォームに送信できます。私たちのこれについては詳細です。
へのリンクTwitterコンテンツ
ムスクによると、AIはすべきです怖いスマート
とても賢いので怖いです。したがって、GROK 3は、CHATGPT-4Oよりも、より良い論理的結論、より多くのコンピューティングパワー、およびより高い適応性を持つ必要があります。
これは、モデルがより速く計算し、複雑な関係をより正確に理解し、さまざまな質問に対してさらに柔軟に反応できることを意味します。
XaiによるとGrok 3にあるもの:
- AIは、Colossus SuperComputer(100,000 NVIDIA H100 GPU)で訓練されたと言われています。
- Grok 2よりも2倍のトレーニングに費やされたと言われています。
- このモデルは、人為的に生成されたデータでトレーニングされました。これ
合成データ
多様で制御されたデータセットを確保し、データ保護に関する懸念を軽減する必要があります。 - 開発者は持っています
手綱フォーメント学習
使用された機械学習の方法で、モデルは報酬関数を使用して出力を評価および改善します。 - またそうでした
人間のフィードバックによる強化学習
(RLHF)適用:ここでは、報酬機能を改良し、AIコンテンツの品質をさらに向上させるために、実際の人々が出力を評価します。 - コンテキストトレーニングは、AIがコンテキストでよりよく理解し、適応することを保証する必要があります。
- LLMは、回答を分析し、事実と比較することにより、自分自身を修正できるはずです。
- DeepSearchを使用すると、拡張された研究と言語機能が提出されます。
大きな目標:幻覚が少なく、論理的精度が高くなります。
幻覚とは何ですか?幻覚は、LLMに関する虚偽または架空の情報を指します。これは、すべての一般的なチャットボットのよく知られている弱点であり、常にAIに生成された答えに疑問を呈するべき主な理由です。
Grok 3はいつ来るのですか?Grok 3は米国でいくつかを使用できるはずです。第一に、それは支払いの加入者(月額40ドル)の番です。ただし、正確なスケジュールはありません。
XaiはEUの規制を満たすために調整を行わなければならないため、Grok 3は当面の間、英国では利用できません。
Grok 3:世界のシュラウストAI?
Grok 3は他のLLMよりもうまくいくことは何ですか? Xaiがライブストリームで示したベンチマークによると、Grok 3は、特に数学、プログラミング、科学的な質問などの論理的なタスクで競争よりも優れています。
ただし、Xaiは他の領域からベンチマークを提示することを控えました - それ以上。
Grok 3がより少ない幻覚を作成することであっても、これはこの目標がすでに達成されているという意味ではありません。 Openaiは、人間のフィードバック(RLHF)を使用した自己補正、合成データ、再執行学習にも依存しています。
AIがどれほど優れているかは、独立したユーザーがテストできる場合にのみ表示されます。
ライブストリームの疑わしい声明
マスクと彼のチームによるいくつかの声明は、誤解を招くまたは誤解を招く可能性があります。だからここでこれに行きたいです:;
究極の真実 - AIを求める
:ムスクは、小川の間に、grok 3が究極の真実であると主張しました。政治的に正しいものと矛盾することがあります
は。彼が他の開発者が事実を積極的に提示したいのか、それが単なる政治的挑発であるかを意図的に事実を美化したいと彼が示したいのかは困難です。
AIは毎日良くなります:マスクは、モデルが毎日さらに改善されると主張しています。これがマイナーな調整を意味する場合、それも大丈夫です。ただし、LLMのトレーニングが出版前に最終的に終了することを明確にしたいと思います。その後、わずかな調整のみが行われます。
驚くべき開発時間:Muskは、Xaiが2023年に発展を開始したばかりで、他の企業は2019年以来LLMに取り組んでいることを強調しました。実際のブレークスルーは開発時間ではなく、膨大な量のデータとコンピューティングパワーのためにあることは言及されていませんでした。したがって、財政的に強力な企業が独自のAIモデルを迅速に開発することは比較的簡単です。
ベンチマークは3つの領域でのみ:Grok 3が言語タスクを使用するなど、他の領域でどれだけ優れているかが開いたままです。マスクと彼のチームは、ロジックタスクのベンチマークしか見せなかったからです。
指定世界のシュレートキ
したがって、検証可能な事実よりもマーケティングが多くなっています。少なくともマスクと彼のチームは、この最上級を正当化する画期的な革新を示していません。
Grok 3が現在トップにいたとしても、Openai、Google、および人類の新しいモデルは確かにすでに開発中です。
世界政府サミット(2月11日から13日)でマスクはこれを言った最後に、他の人がgrokよりも優れていることかもしれません
。それはまだ見られない。
コメント機能はありませんか?
予想される高度な節度のために、コメントをフォーラムに移動することにしました。そこであなたはいつものように議論することができます: