「2025年共通テスト英語リーディングを9大AIモデルで一斉検証!AI競争はまさかの大激戦に?」1位はOpen AIのo1 pro (ChatGPT)か?中国発のDeepSeekやイーロンのGrokは何点?
1.2025年共通テスト英語をAIに解かせたら?
2025年の共通テスト英語(リーディング)を、OpenAI(ChatGPT)やClaude、Grok、Geminiなど9種類の生成AIに解かせたら、どんな点数差が出るのか? 今回はPDFを画像化(スクリーンショット)して各モデルに読み込ませ、読解力&OCR能力を含めた総合力を検証してみました!
2.検証方法:画像化した問題をAIに読み込ませる
2-1. 2025年共通テスト英語リーディング問題を画像化
- 大学入学共通テスト(2025年度)問題・解答速報(1日目)のPDFを、画面キャプチャで大問ごとに画像化。2025年共通テストリーディング問題
- その画像を各AIにアップロードし、OCR(文字認識)+読解させて解答を導きました。基本的に、各生成AIは4枚までしか画像を添付できないので、4枚以上になる大問については、画像を下のように結合して4枚に収めました!
2-2. 9つの生成AIを比較
- OpenAI(ChatGPT)系:o1 pro(有料上位プラン)、o1(plusプラン)、GPT-4、GPT-4o
- 中国発オープンソースAI:DeepSeek V3
- その他:Claude 3.5 Sonnet、Grok(イーロン発)、Gemini 2.0 flash/Gemini 1.5 proなど
OCR精度や回答内容を評価したうえで、共通テストの採点基準に沿って得点化しています。
3.検証結果:OpenAIがトップ、DeepSeekの追い上げに注目
3-1. 順位と得点一覧
- OpenAI o1 pro :92点
- OpenAI o1 :92点
- Claude 3.5 Sonnet :79点
- DeepSeek :75点
- GPT-4o :69点
- Grok :64点
- Gemini 2.0 Flash :52点
- GPT-4 :47点
- Gemini 1.5 pro :44点
napkin.aiで図にしたものがこちら!
総合トップはOpenAI勢2モデル(o1 pro/o1)で、92点と高スコアをマークしました。一方、注目は4位のDeepSeek。GPT-4o(69点)やGrok(64点)を上回る75点を獲得し、オープンソースモデルとして健闘が光ります。
4.主なモデルの特徴と評価ポイント
4-1. OpenAI o1 pro & o1
- 高精度OCR&読解力:月3万円のo1 proは、画像からの文字認識精度が非常に高く、設問の細かなニュアンスまでほぼ取りこぼさない。
- 応答速度はやや遅め:高い性能ゆえか、レスポンスには多少の時間を要する。
- o1はコスパ良し:得点は同じ92点。コスト面ではproほどかからないため、「これで十分」というユーザーも多そう。
4-2. 中国発オープンソース「DeepSeek」
- GPT-4o超え:75点と、GPT-4o(69点)を上回る高得点。
- 画像解析から読解まで:独自のアルゴリズムを採用しており、スクショ入力でも正確な内容把握が可能。
- オープンソースゆえに進化が速い:世界中の開発者が改良に関わり、リリースごとに性能向上が顕著。
- 安定感にまだムラ:大問1の問3画像問題が解読不可など弱点は残るが、潜在力は十分。
4-3. Claude 3.5 Sonnet
- 総合79点:トップ層には及ばないものの、安定した読解力を発揮。
- 一定のOCR能力も確認され、文章理解の要素では優秀。
- 今後のバージョンアップ次第では、トップ争いに絡む可能性大。
4-4. GPT-4o・Grok・Gemini系・GPT-4
- GPT-4o(69点) & Grok(64点):OCRは悪くないが、複数ステップに及ぶ問題の解釈でややミスが散見。
- Gemini 2.0 Flash(52点):新バージョンながら、まだ読解力に粗さが残る。
- GPT-4(47点):画像入力の解釈に苦戦し、一部の設問で大きくポイントを落とす。
- Gemini 1.5 pro(44点):バージョン1.5のためか、2.0よりもさらにスコアは低め。
5.まとめ:AI競争は激化、半年後の勢力図に注目
今回の検証では、OpenAI勢の強さが際立つ一方で、DeepSeekの台頭やClaude 3.5 Sonnetの安定感が、「AI一強ではない」競争を生み出していることが分かりました。
- トップ級(92点):OpenAI o1 pro & o1
- 次点グループ(64~79点):Claude 3.5 Sonnet、DeepSeek、GPT-4o、Grok
- その他:Gemini系、GPT-4はやや苦戦
半年後には、さらに新モデルが台頭したり既存モデルが大幅アップデートされる見込みです。OpenAIのサム・アルトマン氏が2025年1月末に「o3 mini」をリリースするとアナウンスしているように、進化は止まりません。
6.受験&学習シーンを根本から変えるAIの可能性
今回の検証で注目すべきポイントは「画像をアップロードして問題を解かせる」プロセスがすでに実用レベルにあることです。スマホで撮影した問題をすぐにAIへ読み込ませて、リアルタイムで解説を得られる未来はそう遠くないでしょう。
- 弱点分析の自動化:読解ミスをAIが指摘&補足してくれる。
- 模擬試験の自動生成:学習者の習熟度に応じた問題を、AIが瞬時に作成。
- 注意点:AIの回答が完璧とは限らず、最終判断は人間側で行う必要がある。
7.今後の展望:いかに賢くAIを使いこなすか
もはや「AIが共通テストで高得点をとる」こと自体は驚くべきニュースではなくなりつつあります。
とはいえ、新モデルの登場やアップデートペースを考えると、学習者や教育現場がAIをどう使いこなすかが、これからの英語学習・受験対策のカギになりそうです。
- ただ使うだけではもったいない:理解を深めるための補助ツールとして積極的に活用する。
- 情報リテラシーを磨く:誤答や偏った情報を見抜き、うまく利活用する能力が必要。
これからも成長を続ける生成AIと上手に付き合い、最新技術を味方につけた学習を実践していきましょう!!