KP高認パス

ENGLISH PAST EXAM ANALYZER

英語頻出分析

ユーザーが文科省公式ページから取得した英語PDFを端末内で解析し、よく出る単元、文法項目、問題形式、語彙レベルの傾向を可視化します。PDFはサーバーへ送信せず、問題文や設問文は再掲載しません。

LOCAL PDF

公式PDFを選択

ユーザーが文科省公式ページから取得した英語PDFを選択すると、端末内で傾向データを集計します。PDFはサーバーへ送信せず、問題文や設問文は再掲載しません。

PDFここへドラッグ&ドロップまたはクリックして複数PDFを選択

未解析。PDFを選択すると、解析したファイル名と検出した試験回・制度区分を表示します。

ANALYSIS STATUS

解析結果

該当データはない:PDF解析後に、解析したファイル名・試験回・制度区分を表示します。

SECTION B

よく出る単元ランキング

文法項目を単元として集計した、よく出る単元ランキング。
順位単元出現回数出現率
グラフと同一データの表。順位、単元、出現回数、出現率。
順位単元出現回数出現率

SECTION C

近年頻出ランキング

recent_weighted_score = Σ(出現回数 × session_weight)。最新回1.0、一つ前0.8、二つ前0.6、三つ前0.4、それ以前0.2で算出します。

近年頻出ランキング。重み付きスコアと直近の出現を表示。
順位単元重み付きスコア直近の出現

SECTION D

出題形式分布

形式、件数、構成比。
形式件数構成比

SECTION E

年度推移

年度推移グラフと同一データの表。
試験回単元出現回数制度区分

SECTION F

頻出語彙ランキング

wink-NLPで抽出した全英単語をCEFRレベル別に分類し、出現頻度が高い内容語を順に表示します。 固有名詞はNLPの品詞タグで自動検出し、分離表示します。

CEFRとは

Common European Framework of Reference for Languagesの略で、外国語の習熟度をA1からC2までの段階で表す共通のものさしです。この画面では高認の問題文に出る内容語を、A1からB2、試験語彙、未分類に分けて傾向を見ます。

レベルの読み方

A1基礎
短い日常表現や基本語が中心。
A2日常
身近な話題の説明ややり取りで使う語が中心。
B1標準
まとまった文章の理解に出やすい、やや抽象的な語を含む。
B2発展
論説・説明文で使われる専門寄り、抽象寄りの語を含む。
試験語彙CEFR外
月名、曜日、国名形容詞、設問指示語など高認で頻出する専用語。
未分類リスト外
辞書照合では判定できなかった語。固有名詞は別扱いで除外。

頻出語彙トップ30

該当データはない:PDF解析後に頻出語彙ランキングを表示します。

CEFRレベル別語彙分布

該当データはない:PDF解析後にCEFRレベル別語彙分布を表示します。

SECTION G

文法×語彙レベル分析

文法タグとCEFRレベルを組み合わせて、どの文法項目がどのレベルの語彙と一緒に出題されているかを可視化します。 固有名詞はクロス集計から除外しています。

該当データはない:PDF解析後に文法×語彙レベルのクロス集計を表示します。

FILTER

フィルタ

制度区分、試験回範囲、問題形式、文法項目、CEFRレベル、品詞、語彙カテゴリで表示条件を変える。即時反映し、解除ボタンで初期状態に戻せます。

フィルタ未適用:全件表示。集計対象 0件。

NOTES

注記とタグ定義

端末内で抽出した出題傾向データを集計するツールです。問題文・設問文など著作物の表現は保存・再掲載せず、制度区分をまたいだ結果には注意書きを表示します。

全解析ファイル:0件 / 表示中:0

CEFRレベル判定について(v3 精密版)

  • 直接照合:CEFRレベル別語彙リスト(A1〜B2、約2,300語基本形 重複排除済み)との完全一致
  • レンマ照合:wink-NLPの見出し語化(organizations → organization)でリストと照合
  • 語幹照合:58種の派生接辞ルールで基本形を復元(environmental → environment = A2)
  • 接頭辞除去:un-, re-, dis-, inter-, multi- 等16種の接頭辞を除去して照合
  • 複合語分割:ハイフン結合語・長い合成語を分割して各部分を照合(well-known → well + known)
  • 試験語彙(pre-CEFR):国名形容詞(Japanese等)、月名、曜日、試験指示語など、CEFRレベル外だが高認に頻出する71語を専用分類
  • 固有名詞分離:wink-NLPのPROPNタグ+139の固有名詞パターンで自動検出し、CEFR分布から除外

上記すべてで一致しない語が「未分類(リスト外)」として残ります。機能語(冠詞・前置詞・接続詞・代名詞・副詞等 244語)は集計対象外です。

タグ定義を見る