2020年07月11日

何をもって正解とするか 音声ファイルを的確に文字起こしする難しさ

音声ファイルを読める形にして利便性を高める「文字起こし」では、言うまでもなく正確さが大前提となります。ただし「知覚された音韻に忠実であること」と「話し手の意図を的確に反映すること」は、時として一致しないので注意が必要です。

 

何をもって的確な文字起こしとするか

 

 

目次

1. 的確な文字起こしを阻む要因 

「文字起こし」の一言で括られてしまう一連の営みは、話し手の音声が聞き手の耳に届いてから、文字列に変換されて読み言葉として記述されるまで、幾つもの段階に分けられます。文字起こしの質を「話し手の意図を的確に反映しているか」で見た場合、いずれの段階にも質の低下につながる要因がありそうです。

 

人工知能(AI)による音声認識を併用せず、人力で作業を完結させることを想定した場合、以下の各段階と、質を下げてしまう要因を考えることができるでしょう。

 

<話し手の営み>      <質を下げてしまう要因>

話したい内容を思いつく   思いを過不足なく言葉にできない 言い間違い 勘違い

それを音声として発する   声量が不十分 発音が不明瞭 滑舌が悪い

 

<物理的環境>       <質を下げてしまう要因>

(聞き手の耳に届く)    音波の減衰 反響 輻輳 雑音の混入

 

<聞き手の営み>      <質を下げてしまう要因>

話し手の音声を識別する   聴力の不足

音声を文字列に直す     語彙力の不足 文脈を読む能力の欠如

文字列を入力する      誤入力 変換ミス 未熟な整文

 

これらのうち、「話し手の営み」に属する項目は、文字起こしの作業者がコントロールすることは不可能です。「物理的環境」についても、制御できる範囲は限られるでしょう。

 

それでも文字起こしの作業者は、成果物を話者と読み手の双方にとって納得できるものに仕上げなければなりません。ただし、それは容易ではありません。公益社団法人・日本速記協会の機関紙「日本の速記」に紹介されていた幾つかの事例をもとに、作業者として何ができるかを考えてみたいと思います。

 

2. 村上春樹さんが語るには……

文字起こしの質を下げないため、作業者としては、せめて自身でコントロールできることには万全を期したいものです。

 

とはいえ、平素から自己研鑽を積み、語彙力や教養を備えるべく努めていても、神羅万象に精通することはできません。それでも、「にわか玄人(くろうと)」になることはできるし、ならねばならない、と考えさせられるのが、次の事例です。

 

誤:「村上春樹さんが語るには……」

正:「村上春樹さんがカタルーニャ……」

 

村上春樹さんが「カタルーニャ国際賞」(スペインのカタルーニャ自治州政府が文化的または学問的に世界でめざましい活躍をした人物に贈る賞)を2011年に受賞したといった予備知識がないと、「誤」のような文字起こしになってしまう――こうした御経験は、みなさまもお持ちかも知れません。

 

文字起こしの作業中、「誤」のようにしか聞こえないけれども「何か変だな」と気になったときは、聞き取り中の音声で扱われているテーマや固有名詞の検索をしてみると、的確な反訳に必要な情報へと辿り着ける可能性が高まりそうです。この事例に関しては、村上春樹さんがカタルーニャ国際賞を受賞した事実や、受賞スピーチの全文と映像が、いずれもインターネット上に公開されています。

 

文字起こしは、特に本業を別に抱えておられる方にとって、辛いだけの作業と位置づけられがちです。しかし、その辛さを意識するまいとして「文字列生成マシーン」に徹してしまうと、成果物の質を保つうえで必要となる情報にアクセスできる可能性を失いかねません。

 

一方、みなさまが文字起こしを依頼するお立場でしたら、作業者のこうした営みの助けになるような情報も、音源と共にぜひご提供ください。成果物の質は高まり、納期も短縮されると思われます。

 

正確な文字起こしのため校閲用の資料を参照する

 

 

3. カフ控除

同音異義語の反訳ミスは、語彙力と教養で防げることが大半ですが、的確な文字起こしをするうえで判断に迷う場面もあることでしょう。

 

ある地方議会で「カフ控除」に関する指摘がなされました。この「カフ」をどう反訳したものでしょうか。

 

  • 寡婦?
  • 寡夫?

 

文脈からして、いずれも成立し得るケースだったため、議事録ご担当の方が発言者の議員ご本人に、女性の「寡婦」か男性の「寡夫」かを尋ねたところ、回答は「両方を言いたかった」と。

 

話者の意図としては「寡婦・寡夫」と併記されるべきですが、音韻としては「カフ・カフ」ではなく、あくまで「カフ」です。そこで、議事録には、

 

  • 寡婦(夫)

 

と記載されたとの事です。

 

この事例では、上述した「話し手の営み」「発話の環境」「聞き手の営み」のどれにおいても、質を下げてしまう要因は作用していません。それでも、語句を聞こえた通り文字に起こすだけでは、話者の意図に沿った的確な表記とならない点には気を付けたいところです。

 

 

4. 言い間違い・読み間違い

話し手の言い間違い・読み間違いとなると、聞き手のコントロールは及びません。原稿を読み上げている場面での出来事だったとしても、アドリブの可能性を排除できないので、原稿と照合して間違いなのかどうかを断定するのが難しいこともありそうです。

 

次の事例は、1990年代の局アナ誤読伝説として、御存知の方も多いと思います。

 

誤:彼らは、1日中山道(イチニチジュウヤマミチ)を歩きました

正:彼らは、旧中山道(キュウナカセンドウ)を歩きました

 

インターネット時代になっても語り継がれ、詳しく解説しているサイトもあり、真相を窺い知ることが出来ます。

 

国会における閣僚の答弁にも、音声のとおりに文字起こしをしては違和感の残るものがあります。なかには下記の事例のように、日本の Twitter 内でトレンド入りしたものもありました。

 

誤?:「訂正でんでんというご指摘はまったく当たりません」

正?:「訂正云云(うんぬん)というご指摘はまったく当たりません」の読み誤り?

 

文字起こしの作業中、こうした違和感を覚えた時は、やはりそのままにしておくわけにはいかないでしょう。成果物としての性質を考えた上で、発言を音韻のとおりそのまま残すか、正しいと思われるほうに修正して記載するかを判断しなければなりません。 

修正の要否を判断する

 

5. 話し手の意図を的確に伝えられてこそ

文字起こしは、将来、それが読まれて活用される可能性があるからこそ、多大な労力をかけるだけの価値があります。

そうであるならば、作業者に問われているのは、

  • もとの音声から聞き取れる音韻に対する忠実度
  • 漢字変換の精度

もさることながら、最後は

  • 話し手の意図を的確に反映したものに仕立てられるどうか

ということになるでしょうか。

 

音声による話し言葉の持つ豊かな情報は、

  • 文字起こしの過程で削ぎ落されるものが少なからずある
  • 一方、読み言葉としては不要な情報をそのまま引き継いでしまう側面もある

ことにも留意しつつ、よりよい文字起こしと何かについて、引き続き考えていきたいと思います。

話し手の意図が正しく伝わるよう文字起こしする