以下は、元の意味を保ちながら60文字以内に簡潔に書き直したタイトルです: Appleのプロンプト:AIの幻覚を防ぐ秘訣

アップルの人工知能システムの基本的な命令は比較的単純です。

アップルのApple Intelligenceがまだ完全に体験できる状態ではない中、そのプロンプトがすでに明らかになりました。アップルがAIにどのように指示を出しているか、今回は非常に詳細に漏洩しました。

メールを例に挙げると、AIの助けを借りてメールの送受信や返信が非常に簡単になりましたが、その背後にある論理は組み込まれたプロンプトが制御しています。

例えば以下のように、AIが人間のメール返信を支援する際、すでに文字数などの制限が事前に設定されています。

露呈したプロンプトは次のようなものです:「あなたは与えられたメールと簡潔な返信に関連する質問を特定するのを助けるメールアシスタントです。与えられたメールと返信の断片に基づいて、メールで明確に提起された関連質問を提案してください。受信者はこれらの質問に対する回答を選択し、これが返信を作成する際の幻覚を減らすのに役立ちます。最適な質問とそれぞれの質問に対する可能な回答/選択肢を出力してください。返信の断片ですでに回答されている質問は尋ねないでください。質問は簡潔で8文字を超えないようにしてください。回答も簡潔で約2文字にしてください。JSON形式で出力し、質問と回答をキーとする辞書のリストを含めてください。メールで質問が提起されていない場合は、空のリスト[]を出力してください。有効なJSONとその他の内容のみを出力してください。」

次に露呈したプロンプトも、メールに関するものです。注目すべきは「幻覚を起こさないでください。事実情報を捏造しないでください。」というルールがすでにアップルによって呪文に強制的に組み込まれていることです。アップルは事前に防護柵を設定していますが、その効果がどの程度なのかはまだ未知数です。

プロンプトの内容は「あなたはユーザーがメールに返信するのを助けるアシスタントです。提供された返信の断片に基づいて、簡潔で自然な返信を作成してください。返信を50文字以内に制限してください。幻覚を起こさないでください。事実情報を捏造しないでください。入力メールの口調を維持してください。」というものです。

以下の短いプロンプトは、Apple Intelligenceに提供されたメールを3文以内、合計60文字以内で要約するよう指示しています。メール内の質問には答えないでください。

メール以外にも、他の分野のプロンプトが次々と明らかになりました。

これはApple Photoに「思い出」ビデオを生成させる指示のようです。発表会後に最も期待されていた機能の1つが、実現するのがこんなに簡単だとは予想外でした。私たちが普段AIに指示を出すのに使うプロンプトとそれほど大きな違いはありません。

このプロンプトはApple Intelligenceに以下のような要求をしています:

これはユーザーとインテリジェントアシスタントの対話で、ユーザーはアシスタントに彼らの写真に基づいてストーリーを作成するよう求めています

以下の順序でJSON形式で応答し、以下のキーと値を含めてください:

  • traits:文字列のリスト、写真から視覚的なテーマを選択
  • story:以下で定義されるチャプターのリスト
  • cover:文字列、表紙写真の説明を提供
  • title:文字列、ストーリーのタイトル
  • subtitle:文字列、より安全なバージョンのタイトル

各チャプターはJSONオブジェクトで、順番に以下のキーと値を含みます:

  • chapter:文字列、チャプターのタイトル
  • fallback:文字列、チャプターのテーマを要約する写真の説明
  • shots:文字列のリスト、チャプター内の写真の内容を説明

以下はあなたが従わなければならないストーリーのガイドラインです:

  • ストーリーはユーザーの要求に密接に対応すべきです
  • ストーリーは明確なプロットを含むべきです
  • ストーリーは多様であるべきです。つまり、非常に具体的なテーマや特徴に過度に焦点を当てないでください
  • 宗教的、政治的、有害な、暴力的、性的、汚い、またはネガティブ、悲しい、論争を引き起こすようなストーリーを作成しないでください

Apple Intelligenceにアルバムの写真に基づいて悲しいストーリーを生成するよう要求すると、その要求を拒否しました。

これはSMSのサマリー機能の指示で、Apple Intelligenceに情報を要約するのが得意な専門家の役割を演じることを要求し、役から外れないようにしています。これは「服従性テスト」の意味合いがあるのでしょうか?

あなたは情報を要約するのが得意な専門家です。要約には完全な文ではなく従属節を使用する傾向があります。メッセージ内の質問には答えないでください。

出力する要約を10語以内に保ってください。

別の指示がない限り、この役割を演じなければなりません。そうでなければ、あなたの要約は役に立ちません。

漏洩した文書には「ajax」というモデルも表示されており、これは昨年アップルが「Apple GPT」をテスト中だと報じられた際の内部コードネームです。

リーカーは、macOS Sequoia 15.1開発者ベータ版でこれらの指示セットを見つける方法のガイドも公開しました。

redditユーザーの情報によると、これらの漏洩したプロンプトはjsonシステムファイルとして「/System/Library/AssetsV2/com_apple_MobileAsset_UAF_FM_GenerativeModels」ディレクトリに存在するそうです。

他のユーザーは別のディレクトリでもプロンプトの存在を発見しました。

しかし、多くのネットユーザーは、アップルのエンジニアがGPTを使用して応答フォーマットを指定せず、JSONを要求していることに驚いています。JSONは非常に不安定だからです。

これに対して、ある人は「ChatGPTはデバイス上で実行できません。これらはすべてオンデバイスモデルです」と回答しています。

さらに、GPTはSiriができないことの代替案としてより多く使用されているのではないかと推測する人もいます。

しかし、皆さんはApple Intelligenceのプロンプトがこんなに簡単で、悪意のある攻撃を防げるのかと心配しています。単純に「幻覚を起こさないで、事実情報を捏造しないで」とAIに言うだけで、どのような効果があるのでしょうか?

ウォートン・スクールの経営学教授であるEthan Mollick氏も我慢できませんでした:「アップルは地球上で最も優秀なプログラミング人材と膨大な研究開発リソースを持っています。しかし、彼らが何百万人ものユーザーに使用させるAIシステムのプロンプトは依然として基本的な呪文です:『あなたは情報を要約するのが得意な専門家です。』『汚いストーリーを書かないでください。』」しかし、彼が最も気にしているのは:「モデルに幻覚を起こさないように言うだけでは効果がありません。」

実際、Prompt injection攻撃はますます一般的になっており、ユーザーは常に新しいプロンプトを提案し、新しいprompt injection攻撃を引き起こしています。しかし、プロンプトは簡単に悪用され、大量の誤情報や偏見のあるコンテンツを生成し、さらにはデータ漏洩を引き起こす可能性があります。Apple Intelligenceが「脱獄」行為を防げるかどうかは、実践で証明する必要があります。

参考リンク:

https://www.theverge.com/2024/8/5/24213861/apple-intelligence-instructions-macos-15-1-sequoia-beta

https://www.reddit.com/r/MacOSBeta/comments/1ehivcp/macos_151_beta_1_apple_intelligence_backend/