AI美女の崩壊:サイバー妖怪鏡が生成画像の真実を暴く

人工知能による歯科検査

歯を見てみましょう。

画像の彩度を最大にすると、AIが生成した人物の歯がとても奇妙になり、境界線がぼやけます。

全体的な画像の色は正常ですが、マイクの部分は特に奇妙です。

実際の人間の写真と比較すると、このようになるはずです。

歯はくっきりしており、画像の色ブロックは均一で一貫しています。

このツールは既に公開されており、誰でも写真を使って試すことができます。

AIが生成した動画の特定のフレームも、この方法から逃れることはできません。

歯を見せていない写真でも問題が露呈します。

ところで、このツールは### Claudeによって作られました。AIでAIを解読するという不思議な循環です。

正直に言うと、最近のAI人物画像があまりにもリアルで、大きな議論を引き起こしています。例えば、話題になった「TED講演者の動画」シリーズは、実際には一人も本物の人間ではありません。

顔だけでなく、以前のAIの弱点だった文字の書き方も、今では完全に本物と見分けがつかないほどです。

さらに重要なのは、このようなAI人物画像を生成するコストが低いことです。最低5分で、20秒あたり1.5ドル(約10元)程度の価格で作成できます。

これにネットユーザーたちは座視できず、AIの偽物を見破るコンテストを始めました。

約5000人が議論に参加し、この2枚の画像のうちどちらが本物の人間かを議論しています。

理由は様々で、文字やパターンの細部が抽象的だと指摘する人もいれば、人物の目つきが空虚だと感じる人もいます...

最先端のAIが生成する人物画像にはどのような特徴があるのか、徐々に探り出されてきました。

01 細部を見なければ区別が難しい

総合すると、彩度を調整することが現時点で最も迅速な識別方法かもしれません。

AIが生成した集合写真は、この方法でより徹底的に露呈します。

ただし、この方法には一つ問題があります。画像がJPEGアルゴリズムで圧縮された後、この方法が効果を失う可能性があります。

例えば、この写真が本物の人間の写真だと確認されています。

しかし、画質の圧縮や光の問題により、人物の歯もやや不鮮明になっています。

そのため、ネットユーザーたちは人物画像がAIによって合成されたものかどうかを見分けるための他の方法も挙げています。

第一の方法は、簡単に言えば人間の知識に基づいて判断することです。

AIが画像を学習する方法は人間とは異なるため、人間の視点からの視覚情報を100%把握することは難しいです。

その結果、AIが生成した画像には### 現実世界と一致しない部分がしばしば含まれ、これが画像の識別のきっかけとなります。

冒頭の画像を例として使用します。

全体的に見ると、人物の肌が滑らかすぎて、毛穴が全く見えません。この完璧すぎる特徴がかえって不自然さを増しています。

もちろん、この「不自然さ」が必ずしも「偽物」と同義ではありません。肌を磨いた画像でも同様に毛穴は見えないでしょう。

しかし、これが唯一の判断要素ではなく、AIが画像に残す常識との矛盾は一つだけとは限りません。

実際、この画像は少し細部を見るだけで、かなり明らかな特徴が見えます—### 名札の上部のフックの奇妙な接続方法です。

また、高彩度モードで露呈するマイクの問題も、拡大すれば肉眼でも見分けがつきます。

より隠れた特徴としては、髪の毛の先端にある数本の毛の位置が非常に不自然ですが、このような特徴は恐らくレーウェンフックレベルの視力がないと見えないでしょう。

しかし、生成技術の進歩に伴い、見つけられる特徴がますます隠れてしまうのは避けられない傾向です。

もう一つの方法は文字を見ることです。AIは文字の形状の描写において「意味不明な文字」の問題を徐々に克服していますが、正しい実際の意味を持つ文字を正確にレンダリングすることにはまだ困難があります。

例えば、あるネットユーザーは、写真の人物が着用している名札のGoogleロゴの下の最後の行に「CA」という2文字があり、アメリカのカリフォルニア州を表していると気づきました。その前の長い文字列は都市名のはずです。

しかし実際には、カリフォルニア州にはそんなに長い名前の都市は存在しません。

これらの物体自体の細部以外にも、光や影などの情報も真偽を判断するのに使えます。

この画像はある動画から抽出されたもので、その動画には次のようなフレームもあります。

マイクの右側に非常に奇妙な影があり、この影は人物の片手に対応しています。明らかにAIはここでの処理が不十分でした。