文字起こしのコツを探る 音声ファイルをテキスト化するプロの手の動きを観察
文字起こしを手早く済ませるにはタイピングが正確で速いに越したことはありませんが、超絶技巧の使い手にならなければならないわけではありません。熟練者の手の動きを観察すると、誰にでもできるあの工夫が大事であることが見えてきます。
目次
1. AI音声認識かと疑われましたが……
当サイトのコラム「音声認識でなくても毎分300文字! 手入力でも文字起こしはここまで効率化できる」で、熟練者が音声を聞きながら整文反訳して入力を進めている画面のキャプチャー動画をご覧いただいたところ、「滑らかすぎる。本当に人間が手入力しているのか?」というご感想が寄せられました。
注意して見ていただくと、ミスパンチをして入力をやり直したり、音声の再生を一時停止して聴き直したりしている場面もあるのですが、確かに大部分では音声に遅れることなく文字列を滑らかに生成できているので、AI音声認識を作動させている画面の録画かと思われてしまっても無理はありません。
そこで今回は、同じ熟練者が音声ファイルを手入力している様子を、入力画面に加えてキーボードを打つ手指の動きとともに収録した動画をご覧ください。リハーサルは行わず、入力を失敗している場面もそのまま収められていますので、当人がタイピングにおける超絶技巧の持ち主というわけではないことも御理解いただけると思います。
(注:原稿を朗読した音声を逐語反訳していますので、音声と入力内容は原則として一致しますが、句読点を含めて点検前の状態のものである点は御諒承ください)
2. 手入力なのでミスもたくさんしています
文字起こしに用いられた音声は、以下の原稿を朗読したものです。15の文から成る、計449文字の文章です。被写体となった熟練者は約98秒で入力を終えており、1分間あたりに換算した入力速度は約275文字でした。
ミスパンチとそれに伴う入力のやり直しを重ねつつも、14文目までは何とか音声に追随できていました。特に赤字にした部分において、文字列の生成されるスピードが速いことにお気づきになられた方もいらっしゃるのではないでしょうか。
3. ミスによるもたつきを単語登録による省力化でカバー
これらの下線部で熟練者が駆使しているのが単語登録です。この音声の文字起こしにあたっては、少なくとも下記の55語句(初出順に列記)の入力を単語登録によって簡略化できていることが見て取れます。
語句に併記されているアルファベットは、これらの語句を入力する際に打鍵されているキーです。この熟練者の入力方式はローマ字入力で、単語登録する際の「読み」の設定には子音のアルファベットを多用して、自身だけが理解できる多彩な文字列にしていることがわかります。
- まず mz
- 初め hame
- お話 oh
- ます mx
- とき tm
- 病院 bn
- 思います oiu
- お金 ok
- 当然 tz
- こと kt
- であります ds
- さらに srn
- 大きな iin
- なります nam
- たくさん tasa
- ってしまいます fj
- 病気 byo
- というもの fm
- ということ fk
- わかりません wn
- という f
- 必要 hh
- 考え ge
- その sn
- 医療 ir
- 場合 b
- かもしれません kmss
- このような kna
- ように uu
- 我が国 wgk
- あります am
- この kn
- できた cyta
- 人たち hitt
- もの mm
- でありました dsa
- しかし sks
- 現在 gz
- では dh
- 全て sbb
- 国民 kkm
- 入る hru
- なっています naim
- また mt
- 保険料 hkr
- 負担 fnn
- よりまして ytt
- 運営されている uneireteiru
- そして sos
- 私たち wt
- サービス sb
- 医療費 irh
- 支払われる sreru
- 仕組み skm
- 少なくて suukute
4. 打鍵数を全体で4割近く減らせていた
この449文字の朗読をローマ字入力によって文字起こしするのに最低限必要となるキー入力の回数、すなわち打鍵数を、単語登録「あり」の場合と「なし」の場合とで比較してみました。
(注:入力は、ヘボン式のローマ字表記よりも打鍵数が少なくて済む訓令式に準じて行うものとします。また、漢字への変換や、変換の確定、ミスパンチの修正に伴うキー操作は含みません)
単語登録「なし」での入力の場合、必要な打鍵数の合計は、少なくとも933となります。これに対し、上記55語句の単語登録を有効に活用した場合、入力に要する最低限の打鍵数は585となり、37.3%も少なくて済みます。1秒間あたりの打鍵回数は約9.5回から6回弱にまで減らせる計算になりますが、これは普通にブラインドタッチのできる方なら努力次第で到達可能な入力速度といえるでしょう。
5. 単語登録は文字起こしの効率化に欠かせないテクニック
これまで見てきましたとおり、単語登録は入力を省力化・効率化するうえで欠かせないテクニックであることを再確認できました。文字起こしを外注に出せない方は、単語登録をぜひ活用なさってみてください。どなたにでもできるものですので、ご自身なりの法則性を工夫していただきたいと思います。
以下では、今回ご覧いただいた動画の音声入力で打鍵回数をどれだけ減らせているのかを1文ずつ検証していますので、参考例としていただければ幸いです。(単語登録にかかわる部分を赤字にしています)
1文目:まず初めのお話をします。
単語登録なし:mazuhajimenoohanasiwosimasu.(打鍵数28)
単語登録あり:mzhamenoohwosimx.(打鍵数17、削減率39.3%)
2文目:皆さんは体の具合が悪いときには病院に行くと思います。
単語登録なし:minasannhakaradanoguaigawaruitokinihabyouinnniikutoomoimasu.(打鍵数60)
単語登録あり:mishakaradanoguaigawaruitmnihabnniikutooiu.(打鍵数43、削減率28.3%)
3文目:そのときにお金がかかるのは当然のことであります。
単語登録なし:sonotokiniokanegakakarunohatouzennnokotodearimasu.(打鍵数50)
単語登録あり:sonotmniokgakakarunohatznoktds.(打鍵数31、削減率38.0%)
4文目:さらに大きな病院になりますと治療のためにたくさんのお金がかかってしまいます。
単語登録なし:saraniookinabyouinnninarimasutotiryounotamenitakusannnookanegakakattesimaimasu.(打鍵数79)
単語登録あり:srniinbnninamtotiryounotamenitasanookgakakafj.(打鍵数46、削減率41.8%)
5文目:言うまでもないことでありますが、病気というものはいつなるかということがわかりません。
単語登録なし:iumademonaikotodearimasuga,byoukitoiumonohaitunarukatoiukotogawakarimasenn.(打鍵数75)
単語登録あり:iumademonaiktdsga,byofmhaitunarukafkgawn.(打鍵数41、削減率45.3%)
6文目:いざというときに必要なお金が足りないことも考えられます、
単語登録なし:izatoiutokinihituyounaokanegatarinaikotomokangaeraremasu,(打鍵数57)
単語登録あり:izaftmnihhnaokgatarinaifkmogeraremx,(打鍵数36、削減率36.8%)
7文目:そのために医療が受けられない場合があるかもしれません。
単語登録なし:sonotameniiryougaukerarenaibaaigaarukamosiremasenn.(打鍵数51)
単語登録あり:sntameniirgaukerarenaibgaarukmss.(打鍵数33、削減率35.3%)
8文目:このようなことにならないように、我が国には医療のための保険制度というものがあります。
単語登録なし:konoyounakotoninaranaiyouni,wagakuninihairyounotamenohokenseidotoiumonogaarimasu.(打鍵数81)
単語登録あり:knaktninaranaiuu,wgknihairnotamenohokenseidofmgaam.(打鍵数51、削減率37.0%)
9文目:実はこの制度ができたのは大正時代のことであります。
単語登録なし:jituhakonoseidogadekitanohataishoujidainokotodearimasu.(打鍵数55)
単語登録あり:jituhaknseidogacytanohataishoujidainoktds.(打鍵数42、削減率23.6%)
10文目:ただしその当時は一部の人たちだけのものでありました。
単語登録なし:tadasisonotoujihaitibunohitotatidakenomonodearimasita.(打鍵数54)
単語登録あり:tadasisntoujihaitibunohittdakenommdsa.(打鍵数38、削減率29.6%)
11文目:しかし、現在では全ての国民が公的な保険に入ることになっています、
単語登録なし:sikasi,genzaidehasubetenokokumingakoutekinahokennnihairukotoninatteimasu,(打鍵数73)
単語登録あり:sks,gzdhsbbnokkmgakoutekinahokennnihruktninaim,(打鍵数47、削減率35.6%)
12文目:また保険料を納めることになっています。
単語登録なし:matahokennryouwoosamerukotoninatteimasu.(打鍵数40)
単語登録あり:mthkrwoosameruktninaim.(打鍵数23、削減率42.5%)
13文目:みんなで負担することによりましてこの制度が運営されているのであります、
単語登録なし:minnnadefutannsurukotoniyorimasitekonoseidogaunneisareteirunodearimasu,(打鍵数71)
単語登録あり:minnnadefnnsuruktniyttknseidogauneireteirunods,(打鍵数47、削減率33.8%)
14文目:そして私たちが医療サービスを受けたときには医療費の一部が支払われる仕組みになっています、
単語登録なし:sositewatasitatigairyousabisurouketatokinihairyouhinoitibugasiharawarerusikumininatteimasu,(打鍵数92)
単語登録あり:soswtgairsbwouketatmnihairhnoitibugasreruskmninaim,(打鍵数51、削減率44.6%)
15文目:そのため私たちが病院に払うお金は少なくて済むのであります。
単語登録なし:sonotamewatasitatigabyouinnniharauokanehasukunakutesumunodearimasu.(打鍵数67)
単語登録あり:sntamewtgabnniharauokhasuukutesumunods.(打鍵数39、削減率41.8%)