Electronics Pick-up by Akira Fukuda

日本で2番目に(?)半導体技術に詳しいライターのブログ

コラム「セミコン業界最前線」を更新。中国半導体産業の現状を解説

PC Watch様から頂いておりますコラム「セミコン業界最前線」を更新しました。

pc.watch.impress.co.jp

【福田昭のセミコン業界最前線】中国の半導体産業、低い自給率と巨大な貿易赤字の緩和が課題 ~SEMICON CHINA 2018講演会レポート - PC Watch


中国上海で開催された展示会兼講演会「SEMICON CHINA 2018」の講演から、中国の半導体産業の現状を解説しております。

2017年の最新データが盛り込まれているのが、過去の類似記事に比べて新しい点です。


講演スライドの大半は中国語(簡体字)なので、翻訳にかなり苦労しております。

現在のやり方はこうなっています。
画像をまず、文字認識ソフトで読み込む。オンラインの文字認識ツールを利用しています。
ツールの出力はテキスト形式です。

抽出したテキストを百度(Baidu)のオンライン翻訳ツールで英文に変換します。
百度を使うのは、中国語の精度がGoogle翻訳よりも高いからです。特に、繁体字簡体字が混ざっていても、かなり正確に認識してくれるので重宝します。
一方で出力は英語の精度が圧倒的に高く、日本語の精度はものすごく低くて使いものになりません。

一方で、抽出したテキストの中で怪しい部分を日本の漢字に変更して百度(Baidu)の検索エンジンに入力します。
この作業によって文字認識の精度を高めます。

文字を入れ換えて精度を高めたテキストとを、百度のオンライン翻訳に入力して再度、英文に変換します。

以上の作業を、適切と思える精度が得られるまで、繰り返します。
意味が誤りなくつかめるようになり、記事水準の情報が得られるまでの手間は、英文スライドに比べると、3倍~10倍でしょうか。

かなりの手間です。


手間がかかっている割には、日本の皆さまの中国半導体産業に関する定量的な関心は低いようで。
ちょっとくじけてます。

おてすきのときにでも、眺めていただけると、筆者のやる気がアップします。すみません。