大学入学共通テスト英語お役立ち知恵袋&コラム

【共通テスト英語2025年】共テ英語リーディングを色々な生成AIに解かせたところ驚きの事実が判明!【ChatGPT (o1 pro/ o1/ GPT-4o) vs DeepSeek vs Grok vs Claude3.5 Sonnet vs Gemini… 】

「2025年共通テスト英語リーディングを9大AIモデルで一斉検証!AI競争はまさかの大激戦に?」1位はOpen AIのo1 pro (ChatGPT)か?中国発のDeepSeekやイーロンのGrokは何点?

1.2025年共通テスト英語をAIに解かせたら?

2025年の共通テスト英語(リーディング)を、OpenAI(ChatGPT)やClaude、Grok、Geminiなど9種類の生成AIに解かせたら、どんな点数差が出るのか? 今回はPDFを画像化(スクリーンショット)して各モデルに読み込ませ、読解力&OCR能力を含めた総合力を検証してみました!


2.検証方法:画像化した問題をAIに読み込ませる

2-1. 2025年共通テスト英語リーディング問題を画像化

  • 大学入学共通テスト(2025年度)問題・解答速報(1日目)のPDFを、画面キャプチャで大問ごとに画像化。2025年共通テストリーディング問題
  • その画像を各AIにアップロードし、OCR(文字認識)+読解させて解答を導きました。基本的に、各生成AIは4枚までしか画像を添付できないので、4枚以上になる大問については、画像を下のように結合して4枚に収めました!

2-2. 9つの生成AIを比較

  • OpenAI(ChatGPT)系:o1 pro(有料上位プラン)、o1(plusプラン)、GPT-4、GPT-4o
  • 中国発オープンソースAI:DeepSeek V3
  • その他:Claude 3.5 Sonnet、Grok(イーロン発)、Gemini 2.0 flash/Gemini 1.5 proなど

OCR精度や回答内容を評価したうえで、共通テストの採点基準に沿って得点化しています。


3.検証結果:OpenAIがトップ、DeepSeekの追い上げに注目

3-1. 順位と得点一覧

  1. OpenAI o1 pro :92点
  2. OpenAI o1 :92点
  3. Claude 3.5 Sonnet :79点
  4. DeepSeek :75点
  5. GPT-4o :69点
  6. Grok :64点
  7. Gemini 2.0 Flash :52点
  8. GPT-4 :47点
  9. Gemini 1.5 pro :44点

napkin.aiで図にしたものがこちら!

総合トップはOpenAI勢2モデル(o1 pro/o1)で、92点と高スコアをマークしました。一方、注目は4位のDeepSeek。GPT-4o(69点)やGrok(64点)を上回る75点を獲得し、オープンソースモデルとして健闘が光ります。

各設問毎のAIの正答はこちらにまとめました!


4.主なモデルの特徴と評価ポイント

4-1. OpenAI o1 pro & o1

  • 高精度OCR&読解力:月3万円のo1 proは、画像からの文字認識精度が非常に高く、設問の細かなニュアンスまでほぼ取りこぼさない。
  • 応答速度はやや遅め:高い性能ゆえか、レスポンスには多少の時間を要する。
  • o1はコスパ良し:得点は同じ92点。コスト面ではproほどかからないため、「これで十分」というユーザーも多そう。

4-2. 中国発オープンソース「DeepSeek」

  • GPT-4o超え:75点と、GPT-4o(69点)を上回る高得点。
  • 画像解析から読解まで:独自のアルゴリズムを採用しており、スクショ入力でも正確な内容把握が可能。
  • オープンソースゆえに進化が速い:世界中の開発者が改良に関わり、リリースごとに性能向上が顕著。
  • 安定感にまだムラ:大問1の問3画像問題が解読不可など弱点は残るが、潜在力は十分。

4-3. Claude 3.5 Sonnet

  • 総合79点:トップ層には及ばないものの、安定した読解力を発揮。
  • 一定のOCR能力も確認され、文章理解の要素では優秀。
  • 今後のバージョンアップ次第では、トップ争いに絡む可能性大。

4-4. GPT-4o・Grok・Gemini系・GPT-4

  • GPT-4o(69点) & Grok(64点):OCRは悪くないが、複数ステップに及ぶ問題の解釈でややミスが散見。
  • Gemini 2.0 Flash(52点):新バージョンながら、まだ読解力に粗さが残る。
  • GPT-4(47点):画像入力の解釈に苦戦し、一部の設問で大きくポイントを落とす。
  • Gemini 1.5 pro(44点):バージョン1.5のためか、2.0よりもさらにスコアは低め。

5.まとめ:AI競争は激化、半年後の勢力図に注目

今回の検証では、OpenAI勢の強さが際立つ一方で、DeepSeekの台頭やClaude 3.5 Sonnetの安定感が、「AI一強ではない」競争を生み出していることが分かりました。

  • トップ級(92点):OpenAI o1 pro & o1
  • 次点グループ(64~79点):Claude 3.5 Sonnet、DeepSeek、GPT-4o、Grok
  • その他:Gemini系、GPT-4はやや苦戦

半年後には、さらに新モデルが台頭したり既存モデルが大幅アップデートされる見込みです。OpenAIのサム・アルトマン氏が2025年1月末に「o3 mini」をリリースするとアナウンスしているように、進化は止まりません。


6.受験&学習シーンを根本から変えるAIの可能性

今回の検証で注目すべきポイントは「画像をアップロードして問題を解かせる」プロセスがすでに実用レベルにあることです。スマホで撮影した問題をすぐにAIへ読み込ませて、リアルタイムで解説を得られる未来はそう遠くないでしょう。

  • 弱点分析の自動化:読解ミスをAIが指摘&補足してくれる。
  • 模擬試験の自動生成:学習者の習熟度に応じた問題を、AIが瞬時に作成。
  • 注意点:AIの回答が完璧とは限らず、最終判断は人間側で行う必要がある。

7.今後の展望:いかに賢くAIを使いこなすか

もはや「AIが共通テストで高得点をとる」こと自体は驚くべきニュースではなくなりつつあります。
とはいえ、新モデルの登場やアップデートペースを考えると、学習者や教育現場がAIをどう使いこなすかが、これからの英語学習・受験対策のカギになりそうです。

  • ただ使うだけではもったいない:理解を深めるための補助ツールとして積極的に活用する。
  • 情報リテラシーを磨く:誤答や偏った情報を見抜き、うまく利活用する能力が必要。

これからも成長を続ける生成AIと上手に付き合い、最新技術を味方につけた学習を実践していきましょう!!

【大学入学共通テスト英語お役立ち知恵袋&コラム】このコーナーでは、高校英語教師の原田高志が大学入学共通テストのお役立ち情報やテクニックを掲載していきます。英検1級や全国通訳案内士の資格に独学&一発合格したノウハウをふんだんに詰め込んで、皆さんに役立つ情報をご提供します。
関連記事