[過去ログ] + JavaScript の質問用スレッド vol.141 + (1002レス)
上下前次1-新
抽出解除 必死チェッカー(本家) (べ) 自ID レス栞 あぼーん
このスレッドは過去ログ倉庫に格納されています。
次スレ検索 歴削→次スレ 栞削→次スレ 過去ログメニュー
972(8): 2019/09/20(金)02:28 ID:9OhScHGM(1/6)調 AAS
質問です
let str1 = '庭には二羽鶏がいるオムライス食べたい2日目';
let str2 = 'にわにはにわにわとりがいるおむらいすたべたいふつかめ';
このstr2のテキストから
str1の中の平仮名以外の文字の読み仮名に該当する部分を取り出したくて試行錯誤してます
str1を平仮名とそれ以外に割って
['庭','には','二羽鶏','がいる','オムライス食','べたい','2日目']
str2の先頭から、配列2つ目の「には」が出てくるまでが
配列1つ目の「庭」の読み仮名だ!
という方針でやってみて、上記の例だとうまくいくんですが
indexOfの引数になる平仮名が漢字の読みに含まれてしまうと失敗します
let str1 = '煮蛤には焼酎よりも日本酒';
let str2 = 'にはまぐりにはしょうちゅうよりもにほんしゅ';
これだと、配列2つ目の「には」が、読み仮名となる「にはまぐり」に含まれてしまうので
どうも方針が間違ってる気がしているのですが
なにかうまいやり方はありますでしょうか
973: 972 2019/09/20(金)02:35 ID:9OhScHGM(2/6)調 AAS
補足です
str2の平仮名の取得にはgooラボのひらがなAPIを使っています
https://labs.goo.ne.jp/api/jp/hiragana-translation/
981(2): 972 2019/09/20(金)12:53 ID:9OhScHGM(3/6)調 AAS
>>977-979
あざます
やっぱ無理ですかねー
なんかこう、確実に一致する平仮名は含まれているので
うまーくマスキング出来ないかなーとか思って始めてみたんですが
984: 972 2019/09/20(金)14:32 ID:9OhScHGM(4/6)調 AAS
>>983
あざます
形態素解析は>>972よりも先に思いついて、まず品詞で割ってみたんですが
平仮名化の精度が微妙だったんでですよね…
このアプローチも頑張ってみます
985: 972 2019/09/20(金)16:04 ID:9OhScHGM(5/6)調 AAS
>>983
いろいろゴニョゴニョしたんですが
最初は茶筅の形態素解析を使って失敗していたんですが
gooラボの形態素解析APIは品詞分解した結果に読み仮名が付いていました!
これでかなり精度上がりました
ありがとうございました!
993: 972 2019/09/20(金)20:18 ID:9OhScHGM(6/6)調 AAS
まあまあ
>>987
あざます
勉強になりました
上下前次1-新書関写板覧索設栞歴
スレ情報 赤レス抽出 画像レス抽出 歴の未読スレ AAサムネイル
ぬこの手 ぬこTOP 0.321s*