2020年06月10日

文字起こしのコツを探る 音声ファイルをテキスト化するプロの手の動きを観察

文字起こしを手早く済ませるにはタイピングが正確で速いに越したことはありませんが、超絶技巧の使い手にならなければならないわけではありません。熟練者の手の動きを観察すると、誰にでもできるあの工夫が大事であることが見えてきます。

プロの手の動きにみる文字起こしのコツ

 

 

目次

1. AI音声認識かと疑われましたが……

当サイトのコラム「音声認識でなくても毎分300文字! 手入力でも文字起こしはここまで効率化できる」で、熟練者が音声を聞きながら整文反訳して入力を進めている画面のキャプチャー動画をご覧いただいたところ、「滑らかすぎる。本当に人間が手入力しているのか?」というご感想が寄せられました。

 

注意して見ていただくと、ミスパンチをして入力をやり直したり、音声の再生を一時停止して聴き直したりしている場面もあるのですが、確かに大部分では音声に遅れることなく文字列を滑らかに生成できているので、AI音声認識を作動させている画面の録画かと思われてしまっても無理はありません。

 

音声認識ばりの滑らかさ

 

そこで今回は、同じ熟練者が音声ファイルを手入力している様子を、入力画面に加えてキーボードを打つ手指の動きとともに収録した動画をご覧ください。リハーサルは行わず、入力を失敗している場面もそのまま収められていますので、当人がタイピングにおける超絶技巧の持ち主というわけではないことも御理解いただけると思います。

(注:原稿を朗読した音声を逐語反訳していますので、音声と入力内容は原則として一致しますが、句読点を含めて点検前の状態のものである点は御諒承ください)

 

 

 

2. 手入力なのでミスもたくさんしています

文字起こしに用いられた音声は、以下の原稿を朗読したものです。15の文から成る、計449文字の文章です。被写体となった熟練者は約98秒で入力を終えており、1分間あたりに換算した入力速度は約275文字でした。

まず初めお話をします皆さんは体の具合が悪いときには病院に行くと思います。そのときお金がかかるのは当然ことでありますさらに大きな病院なりますと治療のためにたくさんお金かかってしまいます。言うまでもないことでありますが、病気というものはいつなるかということわかりません。いざというとき必要お金が足りないこと考えられますそのために医療が受けられない場合があるかもしれませんこのようなことにならないように我が国には医療のための保険制度というものあります。実はこの制度ができたのは大正時代のことであります。ただしその当時は一部の人たちだけのものでありましたしかし現在では全て国民が公的な保険に入ることなっていますまた保険料を納めることなっています。みんなで負担することよりましてこの制度が運営されているでありますそして私たち医療サービスを受けたときには医療費の一部が支払われる仕組みなっていますそのため私たち病院に払うお金少なくて済むのであります(449文字)

ミスパンチとそれに伴う入力のやり直しを重ねつつも、14文目までは何とか音声に追随できていました。特に赤字にした部分において、文字列の生成されるスピードが速いことにお気づきになられた方もいらっしゃるのではないでしょうか。

 

 

3. ミスによるもたつきを単語登録による省力化でカバー

これらの下線部で熟練者が駆使しているのが単語登録です。この音声の文字起こしにあたっては、少なくとも下記の55語句(初出順に列記)の入力を単語登録によって簡略化できていることが見て取れます。

 

 

語句に併記されているアルファベットは、これらの語句を入力する際に打鍵されているキーです。この熟練者の入力方式はローマ字入力で、単語登録する際の「読み」の設定には子音のアルファベットを多用して、自身だけが理解できる多彩な文字列にしていることがわかります。

  1. まず                          mz
  2. 初め                          hame
  3. お話                          oh
  4. ます                          mx
  5. とき                          tm
  6. 病院                          bn
  7. 思います                    oiu
  8. お金                          ok
  9. 当然                          tz
  10. こと                        kt
  11. であります               ds
  12. さらに                     srn
  13. 大きな                     iin
  14. なります                  nam
  15. たくさん                  tasa
  16. ってしまいます         fj
  17. 病気                        byo
  18. というもの               fm
  19. ということ               fk
  20. わかりません            wn
  21. という                     f
  22. 必要                        hh
  23. 考え                        ge
  24. その                        sn
  25. 医療                        ir
  26. 場合                        b
  27. かもしれません         kmss
  28. このような               kna
  29. ように                     uu
  30. 我が国                     wgk
  31. あります                  am
  32. この                        kn
  33. できた                     cyta
  34. 人たち                     hitt
  35. もの                        mm
  36. でありました            dsa
  37. しかし                     sks
  38. 現在                        gz
  39. では                        dh
  40. 全て                        sbb
  41. 国民                        kkm
  42. 入る                        hru
  43. なっています            naim
  44. また                        mt
  45. 保険料                     hkr
  46. 負担                        fnn
  47. よりまして               ytt
  48. 運営されている         uneireteiru
  49. そして                     sos
  50. 私たち                     wt
  51. サービス                  sb
  52. 医療費                     irh
  53. 支払われる               sreru
  54. 仕組み                     skm
  55. 少なくて                  suukute

 

 

4. 打鍵数を全体で4割近く減らせていた

この449文字の朗読をローマ字入力によって文字起こしするのに最低限必要となるキー入力の回数、すなわち打鍵数を、単語登録「あり」の場合と「なし」の場合とで比較してみました。

(注:入力は、ヘボン式のローマ字表記よりも打鍵数が少なくて済む訓令式に準じて行うものとします。また、漢字への変換や、変換の確定、ミスパンチの修正に伴うキー操作は含みません)

 

単語登録「なし」での入力の場合、必要な打鍵数の合計は、少なくとも933となります。これに対し、上記55語句の単語登録を有効に活用した場合、入力に要する最低限の打鍵数は585となり、37.3%も少なくて済みます。1秒間あたりの打鍵回数は約9.5回から6回弱にまで減らせる計算になりますが、これは普通にブラインドタッチのできる方なら努力次第で到達可能な入力速度といえるでしょう。

 

打鍵数を減らして文字起こしを楽に

 

 

5. 単語登録は文字起こしの効率化に欠かせないテクニック

これまで見てきましたとおり、単語登録は入力を省力化・効率化するうえで欠かせないテクニックであることを再確認できました。文字起こしを外注に出せない方は、単語登録をぜひ活用なさってみてください。どなたにでもできるものですので、ご自身なりの法則性を工夫していただきたいと思います。

 

以下では、今回ご覧いただいた動画の音声入力で打鍵回数をどれだけ減らせているのかを1文ずつ検証していますので、参考例としていただければ幸いです。(単語登録にかかわる部分を赤字にしています)

 

1文目:まず初めお話をします

単語登録なし:mazuhajimenoohanasiwosimasu.(打鍵数28)

単語登録あり:mzhamenoohwosimx.(打鍵数17、削減率39.3%

 

2文目:皆さんは体の具合が悪いときには病院に行くと思います

単語登録なし:minasannhakaradanoguaigawaruitokinihabyouinnniikutoomoimasu.(打鍵数60)

単語登録あり:mishakaradanoguaigawaruitmnihabnniikutooiu.(打鍵数43、削減率28.3%

 

3文目:そのときお金がかかるのは当然ことであります

単語登録なし:sonotokiniokanegakakarunohatouzennnokotodearimasu.(打鍵数50)

単語登録あり:sonotmniokgakakarunohatznoktds.(打鍵数31、削減率38.0%

 

4文目:さらに大きな病院なりますと治療のためにたくさんお金かかってしまいます。

単語登録なし:saraniookinabyouinnninarimasutotiryounotamenitakusannnookanegakakattesimaimasu.(打鍵数79)

単語登録あり:srniinbnninamtotiryounotamenitasanookgakakafj.(打鍵数46、削減率41.8%

 

5文目:言うまでもないことでありますが、病気というものはいつなるかということわかりません

単語登録なし:iumademonaikotodearimasuga,byoukitoiumonohaitunarukatoiukotogawakarimasenn.(打鍵数75)

単語登録あり:iumademonaiktdsga,byofmhaitunarukafkgawn.(打鍵数41、削減率45.3%

 

6文目:いざというとき必要お金が足りないこと考えられます

単語登録なし:izatoiutokinihituyounaokanegatarinaikotomokangaeraremasu,(打鍵数57)

単語登録あり:izaftmnihhnaokgatarinaifkmogeraremx,(打鍵数36、削減率36.8%

 

7文目:そのために医療が受けられない場合があるかもしれません

単語登録なし:sonotameniiryougaukerarenaibaaigaarukamosiremasenn.(打鍵数51)

単語登録あり:sntameniirgaukerarenaibgaarukmss.(打鍵数33、削減率35.3%

 

8文目:このようなことにならないように我が国には医療のための保険制度というものあります

単語登録なし:konoyounakotoninaranaiyouni,wagakuninihairyounotamenohokenseidotoiumonogaarimasu.(打鍵数81)

単語登録あり:knaktninaranaiuu,wgknihairnotamenohokenseidofmgaam.(打鍵数51、削減率37.0%

 

9文目:実はこの制度ができたのは大正時代のことであります

単語登録なし:jituhakonoseidogadekitanohataishoujidainokotodearimasu.(打鍵数55)

単語登録あり:jituhaknseidogacytanohataishoujidainoktds.(打鍵数42、削減率23.6%

 

10文目:ただしその当時は一部の人たちだけのものでありました

単語登録なし:tadasisonotoujihaitibunohitotatidakenomonodearimasita.(打鍵数54)

単語登録あり:tadasisntoujihaitibunohittdakenommdsa.(打鍵数38、削減率29.6%

 

11文目:しかし現在では全て国民が公的な保険に入ることなっています

単語登録なし:sikasi,genzaidehasubetenokokumingakoutekinahokennnihairukotoninatteimasu,(打鍵数73)

単語登録あり:sks,gzdhsbbnokkmgakoutekinahokennnihruktninaim,(打鍵数47、削減率35.6%

 

12文目:また保険料を納めることなっています

単語登録なし:matahokennryouwoosamerukotoninatteimasu.(打鍵数40)

単語登録あり:mthkrwoosameruktninaim.(打鍵数23、削減率42.5%

 

13文目:みんなで負担することよりましてこの制度が運営されているであります

単語登録なし:minnnadefutannsurukotoniyorimasitekonoseidogaunneisareteirunodearimasu,(打鍵数71)

単語登録あり:minnnadefnnsuruktniyttknseidogauneireteirunods,(打鍵数47、削減率33.8%

 

14文目:そして私たち医療サービスを受けたときには医療費の一部が支払われる仕組みなっています

単語登録なし:sositewatasitatigairyousabisurouketatokinihairyouhinoitibugasiharawarerusikumininatteimasu,(打鍵数92)

単語登録あり:soswtgairsbwouketatmnihairhnoitibugasreruskmninaim,(打鍵数51、削減率44.6%

 

15文目:そのため私たち病院に払うお金少なくて済むのであります

単語登録なし:sonotamewatasitatigabyouinnniharauokanehasukunakutesumunodearimasu.(打鍵数67)

単語登録あり:sntamewtgabnniharauokhasuukutesumunods.(打鍵数39、削減率41.8%