2013年12月15日日曜日

サクラエディタでテキストファイルの改行を揃えて見たった

今まさにテープ起こしをやっている。
音源聞きながらメモ帳に文字を起こしていく仕事だ。
テープ起こしとか言いながら、音源はICレコーダから取ったMP3ファイルなんだが・・・

まぁ良い。
とりあえず音源から文字はすべて起こせた。
延べ5時間ほど合ったので、複数の人間で作業にあたったのだが・・・

問題が起こった・・・
みんな、改行の位置が違うのだ。
改行があったりなかったり・・・
もしくは、意味不明なところで改行が入っていたり。
とくに、なんかメモ帳の端に来るたびに改行を入れている人がいて、ちょっと・・・まった・・・これ・・・ヤバイ・・・状態。

うーん、どうしよか?
非常に文章として見難い。

で、考えた末に・・・

・まず、改行を全部なくす。
・そして、「。」句点に改行を付与する

この方法を使うことにした。

まず、使用したのが「サクラエディタ
とりあえず、サクラエディタをダウンロードして、インストールする。

そして、問題のテキストを開く。


まぁ、画面はサンプルファイルなんだ。
文章の終わりに出てくる緑の矢印マークが改行マークだ。
テキストエディタを使ってる人にはお馴染みのマークだろう。

で、仮にこういうふうに意味不明な改行があったとしよう。

まず、一回「名前を付けて保存」する。
そんで、その時に「改行コード」を「CR+LF」として保存するんだ。

コレ大事だからね。
んで、保存したテキストファイルを再度読み込みます。

そして、置換処理を行う。
確か、「Ctrl + "r"」で出てくるはず。
下がそのダイアログボックス。
で、とりあえず改行コードだけ引っ張ってきたいので、「置換前」に「\r\n」と入力してみよう。
続いて「正規表現」にもチェックを入れてみよう。


そうして、検索すると・・・

ほら、改行の部分が黄色くマークされたと思う。
これで改行が選択できることが分かった。

それでは、改行を無くそう。
さっきと同じ要領で、置換のダイアログボックスを開いて、置換前に「\r\n」、正規表現にチェックを入れて、「すべて置換」をクリックする。
この時に、置換後には何も入力してはいけない。


ほら、5箇所を処理しましたって事で、見事に改行が無くなって、ダラダラした文章が出来上がりましたね。

では次に、「。」の後、全てに改行を入れてみよう。
さっきと同じく、置換のダイアログボックスを開きます、ここまでは一緒。
そんで、置換前には「。」、置換後に「。\r\n」と入力します。
コレって、「。」の後に改行マークを入れろってことだよね。


では、早速「すべて置換」をクリックすると・・・
ホイ!
見事、「。」の後が全て改行されました。


これで多少は見やすい文章が出来ましたな。
少なくとも、「。」の後には改行が入ったので、テープ起こしのしごととしては、アリでしょう。

なかなか・・・

まぁ簡単な技術の組み合わせなだけどね。
覚えといて損はないと思うので、書いといた。

では!

0 件のコメント: