閑話休題

ブログの効能と言わば何ぞ其れ日々の由なし事の記帳に限らんや

PDFの文字数カウントの一番簡単な方法

pdfの文字数を数える方法としては,"Jcount"が有力らしいですが,Macでは使えません.ワード又はopen officeで数えてみました.

結果

①htmlの文章をTeX経由でpdf化したものをワードに張り付けて調整:1235文字
②htmlの文章をワードに張り付け:1261字
①/②=98.0%
簡単だし正確だし,この方法が鉄板です!

手順

まずpdfの文章をワードにコピペする.この段階では,半角の空きが所々に挟まることと濁点半濁点が1文字に数えられてしまうというエラーが残ります.そこで,これらの文字を消去していきます.
「shift」+「command」+「H」で「検索と置換」を開き,1文字相当で表示されている濁点を本文中から「検索する文字列」へとコピーアンドペーストします.そして「置換後の文字列」を空欄にして(スペース等が入り込まないように注意)「全て置換」します.こうすると濁点のない文章が出来る訳です.文章としてはマヌケですが,文字数カウントだけであれば不都合は生じません.同様の手順で半濁点と半角空きを処理すれば,ほぼ正しい文字数が得られます.