今週のAI情報:OpenAI と出版社は利便性の提携を発表

AIのように急速に進化する産業についていくのは大変なことです。ですので、AIが代わりに行うまで、最近の機械学習の世界での話題や、個別に取り上げていなかった注目すべき研究や実験をまとめた便利な情報提供をします。

ちなみに、TechCrunchは近くAIニュースレターを開始する予定です。お楽しみに。その間、私たちはこれまで月に2回(たぶん)だった準定期的なAIのコラムを毎週に引き上げていますので、他の版もお見逃しなく。

今週のAIでは、OpenAIが新聞社であるNews Corpとの取引に成功したことを発表しました。この取引では、OpenAIがNews CorpのブランドであるThe Wall Street Journal、Financial Times、MarketWatchなどの記事を訓練する権利を得ています。この合意は多年にわたる歴史的なものであり、OpenAIはNews Corpの出版物からの情報に一部または全部に基づいてChatGPTなどのアプリでNews Corpのマストヘッドを表示する権利も与えられています。

双方にとってWin-Winの取引のようですね。ニュースコープは、メディア業界の見通しが通常よりも暗い時期に、250億ドル以上の資金を得ています。一方、著作権所有者との間で公正な使用に関する争いに関してOpenAIが抱えていたコストの高い裁判に余計な心配が少なくなりました。

しかし、悪魔は細部に宿る。News Corpの取引には終了日があることに留意してください。すべてのOpenAIのコンテンツライセンス取引に終了日があることは、その取引を再交渉する余地を各関係者が持っていることからメディア業界では珍しいことではありません。しかし、OpenAIの最高経営責任者であるSam Altmanの最近のコメントや、AIモデルのトレーニングデータの重要性が減少しているというコメントと照らし合わせて、それは少し疑わしいです。

アルトマンは、「トレーニングデータへのアームズレースは確かに起こらないと思う」と述べ、「モデルが十分にスマートになったとき、ある程度は追加のデータに関してはそうでないべきだ」と述べています。彼はMITテクノロジーレビューのジェームズ・オドネルに「OpenAIやまたは広範なAI業界がより多くのトレーニングデータを必要としない方法を見つける」と述べています。

モデルはまだそれほど「スマート」ではないため、OpenAIは報告によると合成トレーニングデータで実験を行い、ウェブやYouTubeの研究を行っています。しかし、いつか彼らが大幅な改善をするためにほとんど追加のデータを必要としなくなると仮定しましょう。その場合、出版社はどうなるのでしょうか、特にOpenAIが彼らのアーカイブ全体をスクレイプした後は。

私が言いたいのは、出版社やOpenAIが短期的な利便性のパートナーであるように見えるということですが、それ以上ではありません。ライセンス取引を通じて、OpenAIは法的な脅威を効果的に中和し、PRで賞賛を受けることができます。出版社は必要な資本を得ます。そして、出版社に重大な害を与える可能性のあるAIに関する作業は続きます。

この数日間の他のAIに関する注目すべきニュースのいくつかを以下に示します:

  • SpotifyのAI DJ:SpotifyのAI DJ機能の追加は、ユーザーに個別の曲を提供する初めてのステップでした。今、SpotifyはそのDJの代替版を開発しており、スペイン語で話すDJも含まれるようです。
  • MetaのAI委員会:Metaは白人男性だけが参加しているAI諮問委員会の創設を発表しました。これは、AI技術の欠陥の影響を最も受けやすいマージナライズされたグループであることを考えると、やや不適切な感じがします。
  • FCCがAI開示を提案:米連邦通信委員会(FCC)は、政治広告でAI生成のコンテンツが開示されることを要求していますが、禁止されることはありません。
  • あなたの声で応答:広く知られる電話番号識別サービスであるTruecallerは、顧客がAI搭載アシスタントを使用して自分の声で電話に応答できるようになります。
  • Humaneが売却を検討:先月不評だったAI Pinの背後にあるHumane社が買い手を探しています。
  • TikTokが生成AIに取り組む:TikTokは、ブランド向けに新しいTikTok Symphony AIスイートをローンチすることを発表しました。
  • ソウルAIサミット:ソウルで行われたAI安全サミットでは、政府関係者とAI業界の幹部が、急速に進化する分野で初等的な安全対策を適用し、国際的な安全研究ネットワークを設立することに合意しました。
  • MicrosoftのAI PC:Microsoftは、年次のBuild開発者会議で、新しいWindowsマシンとSurfaceラップトップのラインナップを発表しました。
  • OpenAIの音声問題:OpenAIは、ChatGPTのテキスト読み上げ機能から1つの音声を削除しています。
  • 英国の自動運転法:英国の自動車に関する規制が公式化されました。

さらなる機械学習

今週のAIに関連する興味深い研究のいくつか。ワシントン大学の研究者Shyan Gollakotaが、特定の人の声以外をブロックするようにプロンプトできるノイズキャンセリングヘッドフォンのペアを開発しました。これは、アクセシビリティツールとしても日常的なオプションとして役立つもので、これは間違いなく大手テック企業の次世代ハイエンドヘッドフォンに盗まれる可能性がある機能です。

EPFLの化学者は、特定の18つのタスクを履行するのにはっきりと飽きたようで、それらの代わりに行うためにChemCrowと呼ばれるモデルをトレーニングしました。タイトレーションやピペットなどの現実の仕事ではなく、文献を調査しながら反応鎖を計画するなどの作業を計画します。ChemCrowは、研究者たちが全体のセットに対して必要などの検索や計算オプションを使用し、自然言語インターフェースとして機能します。

ChemCrowを披露した論文の責任著者は、それが「電卓やデータベースにアクセスできる人間の専門家に類似している」と述べており、それ以上の重要な作業に取り組んだり、つまらない部分をスキップしたりすることができることを願っています。この名前に関しては、「カラスは道具をうまく使うことが知られている」からです。それで十分です!

Disney Researchのロボティクスチームは、すべての動きの可能性を手でアニメーション化する必要なく、よりリアルに動かすために懸命に取り組んでいます。7月にSIGGRAPHで発表される新しい論文では、手続き的に生成されたアニメーションをアーティストインタフェースと組み合わせて、実際の二足歩行ロボット(グルート)で機能するものが示されます。

アーティストが種類の運動を作成できるようにし、エンジニアはすべての詳細を実装する必要はありませんが、それが一定のパラメータ内であることを確認すれば十分です。提案されたシステムは、具体的な動きを即座に演じることができるため、エンジニアが正確な動きを即興的に行うことができます。数年後にディズニーワールドでこのシステムを見ることができるかもしれません...