プロンプトエンジニアリング
【はじめに】──「GPT-4oって何がそんなにすごいの? 」 こんにちは。ゆずかきです。 最近よく耳にする「GPT-4o」。 でも実際、GPT-4や3.5とどう違うの? 無料ユーザーにも関係あるの? そんな疑問を解決するために、この記事では以下のポイントをわかりやす…
こんにちは、ゆずかきです。 今回は、「DeepSeek-V3」 と呼ばれる最新の大規模言語モデル(LLM)について、私自身が論文を一通り読み込んだ上で、かなりガチ寄りの技術ブログとしてまとめてみたいと思います。 今回紹介する「DeepSeek-V3」は、Mixture-of-Ex…
こんにちは、ゆずかきです。 今回は、「DeepSeek R1」 と呼ばれる、最新の大規模言語モデル(LLM)の推論能力を強化するための研究について、一つの技術ブログ記事としてまとめてみたいと思います。 今回取り上げる「DeepSeek R1」は、arXivにて公開された論…
こんにちは!ゆずかきです。 LCM(大規模概念モデル)について「AI初心者でも楽しく読める」形式に記事化しました! ゆっくり霊夢(以下、霊夢)&ゆっくり魔理沙(以下、魔理沙)という掛け合いで進めますが、なるべく情報を濃縮して「LCMって何?どう使う…
こんにちは!ゆずかきです。 今回は、「STaR(Self-Taught Reasoner)」という新手法を、ゆっくり霊夢(以下、霊夢)&ゆっくり魔理沙(以下、魔理沙)との対話形式で解説していきます。 「AIが自分で書いた推論を再学習する」ってどんな仕組み?…そんな疑問…
こんにちは!ゆずかきです。 今回は、「Chain of Thought(CoT)」という技法を、ゆっくり霊夢(以下、霊夢)&ゆっくり魔理沙(以下、魔理沙)との対話形式で解説していきます。 「推論過程を自然言語で書き出すだけでAIが賢くなる?」と聞くと不思議ですが…