ENGLISH PAST EXAM ANALYZER

英語頻出分析

ユーザーが文科省公式ページから取得した英語PDFを端末内で解析し、よく出る単元、文法項目、問題形式、語彙レベルの傾向を可視化します。PDFはサーバーへ送信せず、問題文や設問文は再掲載しません。

PDFを分析する文科省公式過去問PDFページへ

LOCAL PDF

公式過去問PDFを選択

ユーザーが文科省公式ページから取得した英語PDFを選択すると、端末内で傾向データを集計します。PDFはサーバーへ送信せず、問題文や設問文は再掲載しません。

PDFここへドラッグ&ドロップまたはクリックして複数PDFを選択

未解析。PDFを選択すると、解析したファイル名と検出した試験回・制度区分を表示します。

ANALYSIS STATUS

解析結果

該当データはない：PDF解析後に、解析したファイル名・試験回・制度区分を表示します。

SECTION B

よく出る単元ランキング

文法項目を単元として集計した、よく出る単元ランキング。
順位	単元	出現回数	出現率

グラフと同一データの表。順位、単元、出現回数、出現率。
順位	単元	出現回数	出現率

SECTION C

近年頻出ランキング

recent_weighted_score = Σ(出現回数 × session_weight)。最新回1.0、一つ前0.8、二つ前0.6、三つ前0.4、それ以前0.2で算出します。

近年頻出ランキング。重み付きスコアと直近の出現を表示。
順位	単元	重み付きスコア	直近の出現

SECTION D

出題形式分布

該当データはない：PDF解析後にグラフを表示します。

形式、件数、構成比。
形式	件数	構成比

SECTION E

分野別年度推移

横軸を試験回、縦軸を出現回数として、よく出る単元（上位8項目）ごとの推移を1本ずつの折れ線で表示します。

該当データはない：PDF解析後にグラフを表示します。

年度推移グラフと同一データの表。
試験回	単元	出現回数	制度区分

SECTION F

頻出語彙ランキング

wink-NLPで抽出した全英単語をCEFRレベル別に分類し、出現頻度が高い内容語を順に表示します。固有名詞はNLPの品詞タグで自動検出し、分離表示します。

CEFRとは

Common European Framework of Reference for Languagesの略で、外国語の習熟度をA1からC2までの段階で表す共通のものさしです。この画面では高認の問題文に出る内容語を、A1からB2、試験語彙、未分類に分けて傾向を見ます。

レベルの読み方

A1：基礎: 短い日常表現や基本語が中心。
A2：日常: 身近な話題の説明ややり取りで使う語が中心。
B1：標準: まとまった文章の理解に出やすい、やや抽象的な語を含む。
B2：発展: 論説・説明文で使われる専門寄り、抽象寄りの語を含む。
試験語彙：CEFR外: 月名、曜日、国名形容詞、設問指示語など高認で頻出する専用語。
未分類：リスト外: 辞書照合では判定できなかった語。固有名詞は別扱いで除外。

頻出語彙トップ30

該当データはない：PDF解析後に頻出語彙ランキングを表示します。

CEFRレベル別語彙分布

該当データはない：PDF解析後にCEFRレベル別語彙分布を表示します。

SECTION G

文法×語彙レベル分析

文法タグとCEFRレベルを組み合わせて、どの文法項目がどのレベルの語彙と一緒に出題されているかを可視化します。固有名詞はクロス集計から除外しています。

該当データはない：PDF解析後に文法×語彙レベルのクロス集計を表示します。

NOTES

注記とタグ定義

端末内で抽出した出題傾向データを集計するツールです。問題文・設問文など著作物の表現は保存・再掲載せず、制度区分をまたいだ結果には注意書きを表示します。

全解析ファイル：0件 / 表示中：0件

CEFRレベル判定について（v3 精密版）

直接照合：CEFRレベル別語彙リスト（A1〜B2、約2,300語基本形重複排除済み）との完全一致
レンマ照合：wink-NLPの見出し語化（organizations → organization）でリストと照合
語幹照合：58種の派生接辞ルールで基本形を復元（environmental → environment = A2）
接頭辞除去：un-, re-, dis-, inter-, multi- 等16種の接頭辞を除去して照合
複合語分割：ハイフン結合語・長い合成語を分割して各部分を照合（well-known → well + known）
試験語彙（pre-CEFR）：国名形容詞（Japanese等）、月名、曜日、試験指示語など、CEFRレベル外だが高認に頻出する71語を専用分類
固有名詞分離：wink-NLPのPROPNタグ＋139の固有名詞パターンで自動検出し、CEFR分布から除外

上記すべてで一致しない語が「未分類（リスト外）」として残ります。機能語（冠詞・前置詞・接続詞・代名詞・副詞等 244語）は集計対象外です。

タグ定義を見る