ENGLISH PAST EXAM ANALYZER
英語頻出分析
ユーザーが文科省公式ページから取得した英語PDFを端末内で解析し、よく出る単元、文法項目、問題形式、語彙レベルの傾向を可視化します。PDFはサーバーへ送信せず、問題文や設問文は再掲載しません。
LOCAL PDF
公式PDFを選択
ユーザーが文科省公式ページから取得した英語PDFを選択すると、端末内で傾向データを集計します。PDFはサーバーへ送信せず、問題文や設問文は再掲載しません。
未解析。PDFを選択すると、解析したファイル名と検出した試験回・制度区分を表示します。
ANALYSIS STATUS
解析結果
該当データはない:PDF解析後に、解析したファイル名・試験回・制度区分を表示します。
SECTION B
よく出る単元ランキング
| 順位 | 単元 | 出現回数 | 出現率 |
|---|
| 順位 | 単元 | 出現回数 | 出現率 |
|---|
SECTION C
近年頻出ランキング
recent_weighted_score = Σ(出現回数 × session_weight)。最新回1.0、一つ前0.8、二つ前0.6、三つ前0.4、それ以前0.2で算出します。
| 順位 | 単元 | 重み付きスコア | 直近の出現 |
|---|
SECTION D
出題形式分布
| 形式 | 件数 | 構成比 |
|---|
SECTION E
年度推移
| 試験回 | 単元 | 出現回数 | 制度区分 |
|---|
SECTION F
頻出語彙ランキング
wink-NLPで抽出した全英単語をCEFRレベル別に分類し、出現頻度が高い内容語を順に表示します。 固有名詞はNLPの品詞タグで自動検出し、分離表示します。
CEFRとは
Common European Framework of Reference for Languagesの略で、外国語の習熟度をA1からC2までの段階で表す共通のものさしです。この画面では高認の問題文に出る内容語を、A1からB2、試験語彙、未分類に分けて傾向を見ます。
レベルの読み方
- A1:基礎
- 短い日常表現や基本語が中心。
- A2:日常
- 身近な話題の説明ややり取りで使う語が中心。
- B1:標準
- まとまった文章の理解に出やすい、やや抽象的な語を含む。
- B2:発展
- 論説・説明文で使われる専門寄り、抽象寄りの語を含む。
- 試験語彙:CEFR外
- 月名、曜日、国名形容詞、設問指示語など高認で頻出する専用語。
- 未分類:リスト外
- 辞書照合では判定できなかった語。固有名詞は別扱いで除外。
頻出語彙トップ30
CEFRレベル別語彙分布
SECTION G
文法×語彙レベル分析
文法タグとCEFRレベルを組み合わせて、どの文法項目がどのレベルの語彙と一緒に出題されているかを可視化します。 固有名詞はクロス集計から除外しています。
FILTER
フィルタ
制度区分、試験回範囲、問題形式、文法項目、CEFRレベル、品詞、語彙カテゴリで表示条件を変える。即時反映し、解除ボタンで初期状態に戻せます。
NOTES
注記とタグ定義
端末内で抽出した出題傾向データを集計するツールです。問題文・設問文など著作物の表現は保存・再掲載せず、制度区分をまたいだ結果には注意書きを表示します。
全解析ファイル:0件 / 表示中:0件
CEFRレベル判定について(v3 精密版)
- 直接照合:CEFRレベル別語彙リスト(A1〜B2、約2,300語基本形 重複排除済み)との完全一致
- レンマ照合:wink-NLPの見出し語化(organizations → organization)でリストと照合
- 語幹照合:58種の派生接辞ルールで基本形を復元(environmental → environment = A2)
- 接頭辞除去:un-, re-, dis-, inter-, multi- 等16種の接頭辞を除去して照合
- 複合語分割:ハイフン結合語・長い合成語を分割して各部分を照合(well-known → well + known)
- 試験語彙(pre-CEFR):国名形容詞(Japanese等)、月名、曜日、試験指示語など、CEFRレベル外だが高認に頻出する71語を専用分類
- 固有名詞分離:wink-NLPのPROPNタグ+139の固有名詞パターンで自動検出し、CEFR分布から除外
上記すべてで一致しない語が「未分類(リスト外)」として残ります。機能語(冠詞・前置詞・接続詞・代名詞・副詞等 244語)は集計対象外です。