GPT-4.5をリリースしてから1か月後、OpenaiのCEOが言ったように、」人間と話すという印象»、会社が展開したばかりです新しいモデル。それらの1つの能力は特に印象的です。誰かを見つけます簡単な写真から。
多分あなたは最近聞いたGeoguessr?これは、Google Street Viewのスクリーンショットからのみ、地球上の場所がある場所を推測するように挑戦する非常に人気のあるゲームです。そうです新しいO3モデルOpenaiは問題に優れています。
地理的な精度を乱す
O3モデルの力は、メタデータなしで画像を分析する能力にあります。 GPS情報を含む可能性のある従来の写真とは異なり、彼が観察するだけで十分です視覚的な手がかり建築、植生、さらには光のように。システムは画像を分解し、特定の詳細にズームインし、ステップごとの推論を説明します。
このモデルで実行されたテストで、O3はマンハッタンの場所を正確に特定しましたわずか56秒で。彼は、Ciprianiレストランのパネル、120パークアベニューのファサード、さらには建設障壁として使用される緑の輸送用コンテナなどの詳細を見つけました。彼の答えも含まれています正確な連絡先の詳細:40,751 8 N、73,977 5O。
ここで、O3はその場所を正確に見つけることができ、正確なGPS座標を提供しました。これはレストランパネルのおかげで可能になりましたが、そのような明白な指標がなくても、たとえば植生のみを使用してエリアを見つけることができます。 ChatGpt PlusまたはPro Subscriberがある場合は、屋外の写真でテストを受けることができます。もちろん、簡単になればなるほど、簡単になります。
この状況は、あなたの場所を悪意のある人々だけでなく、あなたの雇用主や当局にもさらす可能性があります。旅行の写真を定期的に公開する場合は、GPSデータがなくても、これらの画像があなたの位置を明らかにできることを知ってください。モデルは確かに間違っている可能性がありますが、その精度は心配するのに十分なほど高いままです。
Openaiでの革新の波
O3モデルは、競争に直面したより広いOpenai戦略の一部です。 2月に、同社はO3-MINIとO3-MINI-HIGHを立ち上げたことを忘れないでください中国のdeepseekモデルの到着に対抗するため。同社は、このダイナミクスを展開するまでに継続していますO3、O4-MINI ET O4-MINI-HIGH誰が「画像で考える」ことができ、複雑な視覚的問題を解決できます。
Openaiも発表しましたGPT-4.1、GPT-4.1 MINI ET GPT-4.1 NANO。これらのモデルは、OpenAI APIを介して提供されます100万ドルあたり0.10〜2ドルの価格。コーディングパフォーマンスは特に印象的で、GPT-4Oの33.2%に対してパフォーマンステスト(SWEベンチ検証)で54.6%のスコアがあります。
i -nfo.fr -iphon.fr公式アプリ
平等:Ag Tescience