現存の大規模言語モデル(LLM)には確かに多くの実用的価値があります。GoogleのDeepMindの研究科学者Nicholas Carliniは、プログラミング、ライティング、新技術の学習など、多岐にわたる分野で彼が仕事でLLMを使用した50以上の事例を詳細に共有しました。
Nicholasは、LLMが過度に誇張されているわけではないと考えています。なぜなら、これらのモデルは実際にますます困難なタスクをこなすことができるからです。過去1年間、彼は毎週少なくとも数時間を様々なLLMとの対話に費やし、これらのモデルは研究プロジェクトやサイドプロジェクトでのコード作成速度を少なくとも50%向上させました。
Nicholasは、LLMを使用した具体的な例をいくつか挙げています:
- これまで使用したことのない技術で完全なウェブアプリケーションを構築する
- 新しいフレームワークやツールの使用方法を学ぶ
- プログラムを自動的にCやRustに変換してパフォーマンスを向上させる
- 大規模なコードベースを簡素化し縮小する
- 研究論文の初期実験コードを書く
- 単調なタスクやワンタイムスクリプトを自動化する
- 新しいソフトウェアのセットアップと設定のためのウェブ検索の代替として使用する
- エラーメッセージのデバッグを支援する
Nicholasはこれらのアプリケーションを、学習を助けるものと退屈なタスクを自動化するものの2つのカテゴリーに分類しています。これらのアプリケーションは派手に見えないかもしれませんが、すべて実際の仕事のニーズから生まれたものであり、仕事の退屈な部分を自動化するLLMの価値を示しています。
セキュリティ研究者として、Nicholasの過去10年間の仕事は、AIモデルが未知の環境で失敗する可能性のある方法を示すことでした。彼はこれらのシステムの限界を完全に理解しています。しかし、それでも彼は、LLMが彼の仕事の効率性にインターネットの誕生以来最大の向上をもたらしたと考えています。
Nicholasは、LLMを使用して完全なアプリケーションを構築し、新しい技術を学ぶ方法について詳しく説明しています。例えば、彼はGPT-4を使用して「GPT-4能力予測チャレンジ」というミニゲームを作成し、アプリケーションの初期バージョンのほぼすべてをGPT-4が完成させました。
新技術の学習に関して、NicholasはLLMをチューターとして使用してDockerなどの新しいツールを学ぶ方法を例示しています。従来の学習方法と比較して、LLMに直接必要な知識を教えてもらう方がはるかに効率的です。
Nicholasがこの記事を書いた目的は、LLMが彼に多くの価値をもたらしていることを証明し、LLMの使い方がわからない人々にいくつかの例を提供することです。彼は、LLMが現在プログラマーの仕事の最も難しく興味深い部分を解決できないことを認めていますが、簡単なタスクをうまく処理し、作業効率を大幅に向上させることができると述べています。
5年前、LLMは せいぜい一見流暢だが実用的には無意味な文章を書くことしかできませんでした。しかし今日、LLMはNicholasのプログラミング効率を平均50%向上させることができます。この進歩は印象的であり、LLMが将来さらに大きな変革をもたらす可能性を示唆しています。