AMC-analyse — AMC選択式試験問題のスキャンデータから自動マーク認識する
auto-multiple-choice
analyse --projet
project-dir
[--seuil-coche threshold
] [--tol-marque tol
] [ --list-fichiers
files-list.txt
| scan-files
... ]
AMC-analyse.plコマンドは、AMC選択式試験問題の答案用紙のスキャンデータから自動マーク認識を実行します。AMC-analyse.plを呼び出す前に、AMC-prepare(1)を呼び出して、作業文書(--mode s
)とMEPファイル(--mode m
)を作成し、AMC-meptex(1)を用いてレイアウトを処理しておかなければなりません。
--data
data-dir
データファイルがあるディレクトリを指定します(AMC-meptex(1)などを参照してください)。デフォルトは
です。project-dir
/data
--cr
project-cr-dir
マーク認識に利用する画像を作成するディレクトリを指定します(ボックスの拡大画像はzooms
サブディレクトリに、氏名記入欄の画像はname-*.jpg
ファイルに、レイアウト結果の画像はpage-*.jpg
ファイルに格納されます)。
--projet
project-dir
--cr
が使用されていない場合、このオプションを使用すると、project-cr-dir
が
に設定されます。project-dir
/cr
処理するスキャンファイルの名前の指定方法には2通りあります:
ファイル名を引数により指定する。
ファイル名をプレーンファイルに(各行に1ファイル名の形式で)列挙して、--list-fichiers
でこのファイルを指定する。files-list.txt
マーク認識用のパラメータは以下のオプションを用いて設定できます:
--prop
proportion
各ボックスのマーク有無を判定する領域の比率を設定します。デフォルト値は0.8です。
--seuil-coche
threshold
ボックスがマークされているかどうか判定する際、AMC-analyse.plは黒ピクセル比率(全ピクセル数に対する黒ピクセル数の割合)をthreshold
(閾値)と比較します。黒ピクセル比率がthreshold
よりも大きい場合、このボックスはマークされていると宣言されます。標準的な値は通常レイアウトで0.15、別紙答案用紙レイアウト(ボックス内に文字が記入されており、受験者にはボックスを完全に塗りつぶすよう指示する)で0.5程度です。AMC-analyse.plを再実行しなくても閾値を調整できるように、黒ピクセル比率はマーク認識データに記録されます。
--bw-threshold
threshold
このパラメータはグレースケールのスキャンデータを白黒に変換する際に使用されます。多くのピクセルを黒とするには、大きな値を使用します。多くのピクセルを白とするには、小さな値を使用します。閾値は0と1の間でなければなりません。デフォルト値は0.6です。
--ignore-red
このオプションを用いると、カラースキャンデータの赤チャネルのみ使用されます。これにより、スキャンデータ上の赤色で記入されたものはすべて無視されます。ボックスが赤で印刷されている場合に有用です。
--tol-marque
tol
スキャンデータの四隅にあるマーカーを検出する際の許容度を定義します。マーカーの検出には、目標サイズtarget
(印刷とスキャンが完璧であった場合のマーカーの正確なサイズ)に近いサイズの、黒い連結領域を探します。tol
が単純な実数の場合、サイズが近いと判断されるのは(1-tol
)*target
から(1+tol
)*target
までの範囲です。tol
が "tinf
,tsup
" の形式(tinf
とtsup
は実数)の場合は(1-tinf
)*target
から(1+tsup
)*target
までの範囲です。標準値は0.2です。
--multiple
このオプションは、試験問題をコピーした(つまり複数の受験者が同じ試験問題に解答しうる)場合に使用します。この場合、同じ試験問題番号をもつ答案用紙が区別できるように、答案用紙に複製番号が割り当てられます。
--pre-allocate
copy_id
このオプションは--multiple
と共に使用されます。スキャンごとの複製番号がcopy_id
から開始し、引数で与えたスキャンデータと同じ順序で割り当てられます。
--debug
file.log
デバッグ情報を記録するファイルを指定します。