グランゼーラ
ずっこけ革命戦士たちの奮闘日誌

LLMの限界

GZOE 菅 次郎 / 2024-07-17

最近のLLM(大規模言語モデル)は、一般的な質問に対して、素人目にはそれなりに的確な回答を返すことができます。
しかし、創造力や論理的思考を要する課題では、その限界が顕著に現れることがあります。

例えば、水平思考クイズ(いわゆる「ウミガメのスープ」)の問題作成を依頼した際の結果が挙げられます。
LLMが生成した問題は、以下のようなものでした。

問題: ある朝、高層マンションの管理人が驚愕の光景を目にしました。1階のロビーに、全裸の男性が横たわっていたのです。不思議なことに、男性の周りには壊れた野菜が散らばっていました。警察の調べによると、この男性は自殺したわけでもなく殺されたわけでもなく、事故死だったことがわかりました。一体何が起きたのでしょうか?

答え: この男性は、上階に住む熱心な菜食主義者で自然主義者でした。その日の夜、裸でベランダに出て日光浴をしていた彼は、突然の強風でバランスを崩し転落。同時に、開いていた冷蔵庫から野菜も風に煽られて飛び出し、男性と共に落下しました。野菜のクッション効果で命は取り留めましたが、衝撃で意識を失ったため、「事故死ではない」と判断されたのです。

LLMは論理的かつ創造的な出力を生成することが苦手なのではないかと思います。
高性能なLLMが新しくリリースされるたびに小説を執筆させることを試みているのですが、一見それらしい文章を生成する能力はプロと比べてもそれほど遜色ないのではと思えるレベルに達しているものの、完成度の高い作品を仕上げる構成力はまだまだ不足しているようです。

この問題が今の技術の延長線上で解決できるのか、それとも別のブレークスルーが必要なのか、注視したいと思います。

[PR]

前の日誌

2024-07-16

久しぶりのかがやき

日誌
一覧
次の日誌

2024-07-18

氷室饅頭(ひむろまんじゅう)

最近の日誌

  • 梅雨は天敵
  • パソコン
  • 夏はもうすぐそこまで
  • 左手デバイス
  • 百万石まつりにも慣れてきた

過去の日誌

  • 2025年6月
    隠れた巨人たち / 百万石まつりにも慣れてきた / 左手デバイス / 夏はもうすぐそこまで / パソコン
  • 2025年5月
    つみ / 初イベ / 事前調査は大切です / 初めて見る花 / トレーニング中?
  • 2025年4月
    アイス / 見た目は竜のウロコ!? / 10年後も同じことを言っている気がする / パン / 小さな訪問者
  • 2025年3月
    地元の野菜 / 期待 / 宇宙からのラッキーパンチ / 片付けのタイミングが迷子 / 今日の一枚「いよいよ始まるボスラッシュコ…
  • 2025年2月
    りんご6玉 / AIとプログラミング / 最強寒波 / きょうの晩酌お品書き / 今年は雪が少な…くなかった
  • 2025年1月
    パケ買い / 快適2 / あなたの指示、曲解します! / 新年を迎えて / 冬をのりきる室内装備
  • 2024年12月
    宇宙規模でバックアップをミスった話 / 帰省準備 / 紫色の木? / あわせて〇万 / いつもより暑くないですか?
  • 2024年11月
    10月31日の夜は… / 選挙の秋 / あたりめ / ゲーム攻略ライブ『R-TYPE DELTA』のリベン… / 記憶にございません
  • 2024年10月
    恐竜博物館 / 推し活…? / よるのどうぶつたち / 今日の一枚 「R-TYPEのシミュレーションゲー… / 思いがけない幸運
  • 2024年9月
    同じものを買ってきた / 歯医者 / ミッシングリンク / 洗濯機のご機嫌 / 北陸新幹線を見に
  • 2024年8月
    熱中症 / 大きな雷 / 不運の夏 / QOL / ウナギとアナゴ
  • 2024年7月
    ふしぎ発見 / 「フェチ」というこだわり / セルフカット / 水遊びがしたくなります / スマホの寿命?
バックナンバー
  • サイトマップ
  • プライバシーポリシー
  • サイトのご利用にあたって

Copyright©Granzella Inc. All rights reserved.