原田英語.com

大学入学共通テスト英語お役立ち知恵袋＆コラム

【共通テスト英語2025年】共テ英語リーディングを色々な生成AIに解かせたところ驚きの事実が判明！【ChatGPT (o1 pro/ o1/ GPT-4o) vs DeepSeek vs Grok vs Claude3.5 Sonnet vs Gemini… 】

haradaeigo 2025-01-19

「2025年共通テスト英語リーディングを9大AIモデルで一斉検証！AI競争はまさかの大激戦に？」1位はOpen AIのo1 pro (ChatGPT)か？中国発のDeepSeekやイーロンのGrokは何点？

1．2025年共通テスト英語をAIに解かせたら？

2025年の共通テスト英語（リーディング）を、OpenAI（ChatGPT）やClaude、Grok、Geminiなど9種類の生成AIに解かせたら、どんな点数差が出るのか？　今回はPDFを画像化（スクリーンショット）して各モデルに読み込ませ、読解力＆OCR能力を含めた総合力を検証してみました！

2．検証方法：画像化した問題をAIに読み込ませる

2-1. 2025年共通テスト英語リーディング問題を画像化

大学入学共通テスト（2025年度）問題・解答速報（1日目）のPDFを、画面キャプチャで大問ごとに画像化。2025年共通テストリーディング問題
その画像を各AIにアップロードし、OCR（文字認識）＋読解させて解答を導きました。基本的に、各生成AIは4枚までしか画像を添付できないので、4枚以上になる大問については、画像を下のように結合して4枚に収めました！

2-2. 9つの生成AIを比較

OpenAI（ChatGPT）系：o1 pro（有料上位プラン）、o1（plusプラン）、GPT-4、GPT-4o
中国発オープンソースAI：DeepSeek V3
その他：Claude 3.5 Sonnet、Grok（イーロン発）、Gemini 2.0 flash／Gemini 1.5 proなど

OCR精度や回答内容を評価したうえで、共通テストの採点基準に沿って得点化しています。

3．検証結果：OpenAIがトップ、DeepSeekの追い上げに注目

3-1. 順位と得点一覧

OpenAI o1 pro ：92点
OpenAI o1 ：92点
Claude 3.5 Sonnet ：79点
DeepSeek ：75点
GPT-4o ：69点
Grok ：64点
Gemini 2.0 Flash ：52点
GPT-4 ：47点
Gemini 1.5 pro ：44点

napkin.aiで図にしたものがこちら！

総合トップはOpenAI勢2モデル（o1 pro／o1）で、92点と高スコアをマークしました。一方、注目は4位のDeepSeek。GPT-4o（69点）やGrok（64点）を上回る75点を獲得し、オープンソースモデルとして健闘が光ります。

各設問毎のAIの正答はこちらにまとめました！

4．主なモデルの特徴と評価ポイント

4-1. OpenAI o1 pro & o1

高精度OCR＆読解力：月3万円のo1 proは、画像からの文字認識精度が非常に高く、設問の細かなニュアンスまでほぼ取りこぼさない。
応答速度はやや遅め：高い性能ゆえか、レスポンスには多少の時間を要する。
o1はコスパ良し：得点は同じ92点。コスト面ではproほどかからないため、「これで十分」というユーザーも多そう。

4-2. 中国発オープンソース「DeepSeek」

GPT-4o超え：75点と、GPT-4o（69点）を上回る高得点。
画像解析から読解まで：独自のアルゴリズムを採用しており、スクショ入力でも正確な内容把握が可能。
オープンソースゆえに進化が速い：世界中の開発者が改良に関わり、リリースごとに性能向上が顕著。
安定感にまだムラ：大問１の問３画像問題が解読不可など弱点は残るが、潜在力は十分。

4-3. Claude 3.5 Sonnet

総合79点：トップ層には及ばないものの、安定した読解力を発揮。
一定のOCR能力も確認され、文章理解の要素では優秀。
今後のバージョンアップ次第では、トップ争いに絡む可能性大。

4-4. GPT-4o・Grok・Gemini系・GPT-4

GPT-4o（69点） & Grok（64点）：OCRは悪くないが、複数ステップに及ぶ問題の解釈でややミスが散見。
Gemini 2.0 Flash（52点）：新バージョンながら、まだ読解力に粗さが残る。
GPT-4（47点）：画像入力の解釈に苦戦し、一部の設問で大きくポイントを落とす。
Gemini 1.5 pro（44点）：バージョン1.5のためか、2.0よりもさらにスコアは低め。

5．まとめ：AI競争は激化、半年後の勢力図に注目

今回の検証では、OpenAI勢の強さが際立つ一方で、DeepSeekの台頭やClaude 3.5 Sonnetの安定感が、「AI一強ではない」競争を生み出していることが分かりました。

トップ級（92点）：OpenAI o1 pro & o1
次点グループ（64～79点）：Claude 3.5 Sonnet、DeepSeek、GPT-4o、Grok
その他：Gemini系、GPT-4はやや苦戦

半年後には、さらに新モデルが台頭したり既存モデルが大幅アップデートされる見込みです。OpenAIのサム・アルトマン氏が2025年1月末に「o3 mini」をリリースするとアナウンスしているように、進化は止まりません。

6．受験＆学習シーンを根本から変えるAIの可能性

今回の検証で注目すべきポイントは「画像をアップロードして問題を解かせる」プロセスがすでに実用レベルにあることです。スマホで撮影した問題をすぐにAIへ読み込ませて、リアルタイムで解説を得られる未来はそう遠くないでしょう。

弱点分析の自動化：読解ミスをAIが指摘＆補足してくれる。
模擬試験の自動生成：学習者の習熟度に応じた問題を、AIが瞬時に作成。
注意点：AIの回答が完璧とは限らず、最終判断は人間側で行う必要がある。

7．今後の展望：いかに賢くAIを使いこなすか

もはや「AIが共通テストで高得点をとる」こと自体は驚くべきニュースではなくなりつつあります。
とはいえ、新モデルの登場やアップデートペースを考えると、学習者や教育現場がAIをどう使いこなすかが、これからの英語学習・受験対策のカギになりそうです。

ただ使うだけではもったいない：理解を深めるための補助ツールとして積極的に活用する。
情報リテラシーを磨く：誤答や偏った情報を見抜き、うまく利活用する能力が必要。

これからも成長を続ける生成AIと上手に付き合い、最新技術を味方につけた学習を実践していきましょう！！

【追記】この記事を書いた2日後に、DeepSeek-R1という最新モデルが登場しました。このモデルは、PDFをそのまま放り込んで問題を解かせることができるので、上の検証方法とは違いますが、解かせた結果を公表します！！

https://x.com/slangjiten/status/1881651926460412353

85点でした！完全無料でこの精度。。。中国発のDeepSeek、恐るべし！

【大学入学共通テスト英語お役立ち知恵袋＆コラム】このコーナーでは、高校英語教師の原田高志が大学入学共通テストのお役立ち情報やテクニックを掲載していきます。英検１級や全国通訳案内士の資格に独学＆一発合格したノウハウをふんだんに詰め込んで、皆さんに役立つ情報をご提供します。

Claude grok ChatGPT DeepSeek o1 pro o1

英語＆英会話学習に使えるプロンプト

【英単語超絶暗記プロンプト】大学入試/英検/TOEIC/IELTS/TOEFL等々！どんな難しい英単語も超絶面白く分かりやすく覚えられる究極メソッド！コピペで使えるChatGPT×原田英語＆英会話メソッド GPTsつき

2024-12-31 haradaeigo

原田英語.com

大学入学共通テスト英語お役立ち知恵袋＆コラム

【「共通テストを制服と私服のどちらで受けるべき？」最終結論は私服一択！】現役高校生の制服/私服割合は？Yahoo知恵袋民の意見は？

2025-01-11 haradaeigo

原田英語.com

英語＆英会話学習に使えるプロンプト

【コピペで使える超絶英作文採点プロンプト】ChatGPT×原田英語＆英会話メソッド活用法 ――「超詳解」×「超スピード」の最強AI添削で、英作文が最短で爆伸び！――

2024-12-30 haradaeigo

原田英語.com

大学入学共通テスト英語お役立ち知恵袋＆コラム

【大学入学共通テスト受験持ち物完全ガイド】～基礎から隠れ神アイテムまで、本番でつかえるファイナルチェックリスト～

2025-01-13 haradaeigo

原田英語.com

大学入学共通テスト英語お役立ち知恵袋＆コラム

共通テストに超絶オススメのクッションや座布団はコレ！【大学入学共通テスト英語&お役立ち知恵袋＆コラム】

2024-12-22 haradaeigo

原田英語.com

大学入学共通テスト英語お役立ち知恵袋＆コラム

【紙に書いて英語で唱えるだけで“脳が勝手に大学入試合格へ導く”アファメーション超実践メソッド】～すぐにつかえる英語×日本語affirmationつき！～【大学入学共通テスト英語&お役立ち知恵袋＆コラム】

2025-01-01 haradaeigo

原田英語.com