2020年10月16日

文字起こしのツボ「同音異義語」でしくじらないために

日本語による文筆に携わるうえで、避けて通れないのが同音異義語。文字起こしにおいては、変換ミスが一つでもあると信頼度を大きく損ねてしまいます。反訳の実務家としての経験を振り返りながら、注意すべき点について考えたいと思います。

当サイトのコラム「文字起こしのツボ『同音異義語』を数学的に考察する」でみたように、日本語には音韻が約100あるので、理屈の上では、音韻をどんどん継ぎ足していくことで、その並び順のバリエーションとしての言葉を限りなく増やしていくことができてしまいそうです。

ただ、読みが何十文字にも及ぶような単語は、読むにも書くにも手間暇がかかるため、現実的にはせいぜい2~5文字くらいに収めなければならないでしょう。一方、短い言葉ほど、音韻の並び順のバリエーションも限られるのも事実です。このため、例えば音韻が二つの場合、「雨と飴」「橋と箸」といった同音異義語が存在することになります。

 

文字起こしで注意すべき点とは

 

 

目次

1. 聞こえ方が同じ言葉を識別して反訳するには

「書き言葉」において、同音異義語は、漢字仮名交じり表記をすることで識別が容易になります。ところが、文字面には頼れない「話し言葉」の中で同音異義語を誤解なく使いこなすには、話す側が発音の仕方に何らかの工夫をしなければなりません。

とはいえ、現代の日本語の場合、母音の発音が変化に乏しく、例えば「ア」の音はあくまで「ア」であって、英語のように「æ」や「ʌ」を使い分けることはありません。

個々の母音ではなく、単語という音韻のまとまりの中では、強弱アクセントや高低アクセントを日本語でも変えています。ただし、あまたある同音異義語をそれだけで識別しきることは困難です。

また、人によってイントネーションに微妙な違いがあるため、結局は文脈から「雨」なのか「飴」なのかを推測しなければなりません。

 

ただ、島国という地政学的に閉ざされた環境下で、人々の持つ価値観や概念が均質化しやすかったことは、グローバル化が進む現在においても、なお有利に作用しているようです。同音異義語が出てきた時、イントネーションが曖昧でも、どの意味で使っているかが「空気」で通じてしまうのは、反訳の実務で少なからず経験することです。

 

一方、英語ではどうでしょうか。アルファベットは、日本語の仮名の半分の26文字しかありませんが、ある研究では、母音は16~26個あるとされています。

子音との組み合わせパターンは日本語を優に超えます。しかも、一つの単語が2文字から5文字程度の日本語と違い、どんどん文字を足していって、スペルが10文字を超えるような単語もざらにあります。有名なところでは「菊/chrysanthemum」が13文字もあります。それゆえ、日本語ほど多数のダブり(同音異義語)は存在しないのかも知れません。すぐに思いつくのは、「週/week」と「弱い/weak」くらいです。

 

ちなみに、同音異義語がたくさんある日本語には、それを逆手に取って、「駄じゃれ」という言葉遊びがあります。日本では、おじさんが連発するくだらないギャグのように受け止められていますが、英語圏では、逆にそういった言葉遊びが少ないために(韻を踏むなども含め)おしゃれで高尚な文学表現とされています。シェイクスピアの戯曲など、見ようによっては、おやじギャグのオンパレードと言えなくもないのですが……。

 

というわけで、日本語の文章に携わる以上、同音異義語の問題は避けて通れません。最も反訳ミスが生じるのも、まさにこの部分です。

 

最も反訳ミスが生じるのは?

 

 

2. 文字起こしに「絶対の正解」はない

ある単語(音韻の並び順)に対して、複数の同音異義語があり得る場合、その漢字仮名交じり表記を一つには絞り切れないことがあります。候補となる単語のそれぞれの意味が明確に仕切られていればよいのですが、実際はそれらの中間に、どちらとも決めがたいグレーゾーンが広がっているからです。

発言者本人が、候補となる同音異義語の意味の違いを明確に意識せず、広範囲にまたがるような感じで、漠然と言葉を発しているときさえあります。そうなると、受け手によって捉え方が変わってしまい、反訳者としては「これで正しい」と思って入力した漢字表記を、依頼主の手で修正されてしまうことも少なくありません。

 

プロとして確信をもって選んだ字をたとえ修正されても、「見解の相違」だと割り切るしかないのかな、と思うこともあります。あるいは、依頼主の担当者が別の人だったら、オーケーだったかもしれないのです。文字起こしでは正確さが第一に求められるものの、「絶対の正解」というものはないのだなと実感させられること頻りです。

 

 

3. 確率で判断しなければならない文字起こしも

頻繁に登場する使い分けの難しい漢字表記の言葉の代表例に、

  • 保証/保障/補償

があります。辞書上の定義は明確に分かれているのですが、実際の録音音声の中に登場すると、どれとも取れる場合が多々あります。ひどいときには、前後の脈絡なく、突然ワンフレーズだけ発言者の口から飛び出してきたりして、どういう意味か推理する手がかりもなく、お手上げになってしまいます。

その場合は、反訳者が何だかんだ自分なりに理屈をつけて、「きっとこういうつもりだったのだ」と解釈し、一番可能性のありそうな字を当てたりします。

 

あるいは、皆目予想もつかないときは、カタカナで表記することによって、「音は聞き取れているのですが正確な漢字が不明です」という意思表示を示し、依頼主側の判断に委ねてしまうこともあります。

「株式会社○○こうぎょう」などという固有名詞は、音声だけでは「工業/興業/鋼業」など、複数の漢字がほぼ等確率で考えられるので、「○○コウギョウ」としておきます。もっともこの辺は、文字起こしを依頼する相手方の担当者も心得ているので、クレームがつくことはまずありません。

 

「正解を確率で推測する」というと、まるで「シュレディンガーの猫」ならぬ物理学の量子論みたいですが、文字起こしに限らず、文章を作成するという行為は、実は数学的な一面も持ち合わせていると思います。優れた反訳者になるには、理数系のセンスまで求められるというこということでしょうか。

 

文字起こしの正解を確率で推測する

 

 

4. 反訳の初心者は「活字のマジック」にご用心

注意すべきは「活字のマジック」です。パソコンのワープロソフトで原稿を打っていると、画面には明朝体などの折り目正しい字体で、文字が表示されます。こうして活字になるということが、実は妙に説得力を持っていて、一見すると、本当は誤字なのに、さも合っているかのような錯覚に陥ってしまうのです。

 

経験を積むと、20~30個くらいの「しょっちゅう誤変換が生じる語句」があることに気づきます。これを覚えてしまえば、毎回の反訳作業をするときに、その語句が出てきたときは常に立ち止まり、前後の文脈を改めてよく考えたり、辞書を引いたりする習慣が身についてきます。そうやって、次第に作業が効率化し、スピードアップできるようになるのです。

 

誤変換の代表的な要注意語句としての同音異義語には、

  • 回答/解答
  • 的確/適格
  • 非難/避難
  • 主催/主宰
  • 保健/保険

などがあります。改めて触れる機会もあろうかと思いますが、ご参考にしていただけますならば幸いです。

 

活字のマジックに注意する