グランゼーラ
ずっこけ革命戦士たちの奮闘日誌

LLMの限界

GZOE 菅 次郎 / 2024-07-17

最近のLLM(大規模言語モデル)は、一般的な質問に対して、素人目にはそれなりに的確な回答を返すことができます。
しかし、創造力や論理的思考を要する課題では、その限界が顕著に現れることがあります。

例えば、水平思考クイズ(いわゆる「ウミガメのスープ」)の問題作成を依頼した際の結果が挙げられます。
LLMが生成した問題は、以下のようなものでした。

問題: ある朝、高層マンションの管理人が驚愕の光景を目にしました。1階のロビーに、全裸の男性が横たわっていたのです。不思議なことに、男性の周りには壊れた野菜が散らばっていました。警察の調べによると、この男性は自殺したわけでもなく殺されたわけでもなく、事故死だったことがわかりました。一体何が起きたのでしょうか?

答え: この男性は、上階に住む熱心な菜食主義者で自然主義者でした。その日の夜、裸でベランダに出て日光浴をしていた彼は、突然の強風でバランスを崩し転落。同時に、開いていた冷蔵庫から野菜も風に煽られて飛び出し、男性と共に落下しました。野菜のクッション効果で命は取り留めましたが、衝撃で意識を失ったため、「事故死ではない」と判断されたのです。

LLMは論理的かつ創造的な出力を生成することが苦手なのではないかと思います。
高性能なLLMが新しくリリースされるたびに小説を執筆させることを試みているのですが、一見それらしい文章を生成する能力はプロと比べてもそれほど遜色ないのではと思えるレベルに達しているものの、完成度の高い作品を仕上げる構成力はまだまだ不足しているようです。

この問題が今の技術の延長線上で解決できるのか、それとも別のブレークスルーが必要なのか、注視したいと思います。

[PR]

前の日誌

2024-07-16

久しぶりのかがやき

日誌
一覧
次の日誌

2024-07-18

氷室饅頭(ひむろまんじゅう)

最近の日誌

  • 北の大地
  • カードドロー
  • 思索にふける
  • 無限の宇宙と、確率のオニギリ
  • 草と雪と

過去の日誌

  • 2026年6月
    新たな仲間 / スマートフォン / ローカルLLMデビュー / 暑いと寒いの話しかしてない気がする / 草と雪と
  • 2026年5月
    ああ… / 運動不足 / 本当にたくさんのチューリップ / お泊り / かばんの中も机の中も探したけれど見つから…
  • 2026年4月
    詰めの甘さにあとから気づく / 花粉症 / 春が来た / 味覚で楽しむ春 / 花見と花粉と
  • 2026年3月
    腸活 / ***の穴からコンニチワ!! / アインシュタイン以来の素通り / 輝く雪吊り / 水漏れ修理
  • 2026年2月
    地上300メートルから / 雪中朝活 / 慣れ / 謎解きは日曜の夜に / 雪かきゲーム
  • 2026年1月
    初詣 / 新年の目標をぼんやり考えてみる / 覚えていること / どうせなら… / 動物園
  • 2025年12月
    29番目の家族 / 富山ブラックラーメン / 裏返る傘 / たこ焼き / 記憶容量
  • 2025年11月
    風邪 / 自転車はキレイに使いたい / キャッシュレスと一万円札 / 数年ものの梅酒 / 紅葉を見に行こう
  • 2025年10月
    立体にて / 食欲2倍 / 大阪に行ってきました / 記憶容量 / 最近の趣味
  • 2025年9月
    踊る夕暮れ / 映画は映画館で / は / 暑さ寒さも彼岸まで / マイベストたこ焼き
  • 2025年8月
    打ち上げ花火をどこから見るか / スーパー銭湯 / 酷暑 / スイカ / スマホで世界に感謝する
  • 2025年7月
    うめ / そば / 手をかざすと / サブスク / 音楽イベント
バックナンバー
  • サイトマップ
  • プライバシーポリシー
  • サイトのご利用にあたって

Copyright©Granzella Inc. All rights reserved.