[過去ログ] くだすれPython(超初心者用) その46【Ruby禁止】 (1002レス)
前次1-
抽出解除 必死チェッカー(本家) (べ) 自ID レス栞 あぼーん

このスレッドは過去ログ倉庫に格納されています。
次スレ検索 歴削→次スレ 栞削→次スレ 過去ログメニュー
リロード規制です。10分ほどで解除するので、他のブラウザへ避難してください。
258
(2): デフォルトの名無しさん [sage] 2020/01/18(土) 12:28:11.28 ID:bny/49Iw(1/16) AAS
日本語表記のあるcsvファイルをdfとして読み込もうとしているのですが、

df_descr = pd.read_csv(descr_path,encoding='SHIFT-JIS')

を実行したところ

例外が発生しました: UnicodeDecodeError
'utf-8' codec can't decode byte 0x82 in position 0: invalid start byte

のメッセージが出現して読み込みできません。
SHIFT-JISの設定だけではいけないのでしょうか?
261: デフォルトの名無しさん [sage] 2020/01/18(土) 12:43:37.61 ID:bny/49Iw(2/16) AAS
>>260
CP932
もダメでした。

pythonで日本語取扱うのってかなりハードル高いんでしょうか?
想定ユーザーは英語識字能力高くないので、日本語でいきたいのですが・・・。
263: デフォルトの名無しさん [sage] 2020/01/18(土) 12:51:58.74 ID:bny/49Iw(3/16) AAS
>>262
だめでした。
テストのため
Excelで



の一文字だけ入力してcsvで保存しているのですが、ファイルの保存方法の設定を変えるべきなのかな。
265
(1): デフォルトの名無しさん [sage] 2020/01/18(土) 13:04:47.84 ID:bny/49Iw(4/16) AAS
>>264
ignoreとかいろいろ設定ためしてみたのですが、全て同じエラー
考えてみるとshift-jisって指定しているのにutf-8でエラーってなんかへんですよね
267
(1): デフォルトの名無しさん [sage] 2020/01/18(土) 13:13:41.09 ID:bny/49Iw(5/16) AAS
anacondaでpython3.7使ってます
269
(1): デフォルトの名無しさん [sage] 2020/01/18(土) 13:40:28.54 ID:bny/49Iw(6/16) AAS
>>268
ありがとうございます。
ためしてみたのですが、

例外が発生しました: UnicodeDecodeError
'utf-8' codec can't decode byte 0x82 in position 0: invalid start byte

でした・・・。
272
(3): デフォルトの名無しさん [sage] 2020/01/18(土) 14:01:46.35 ID:bny/49Iw(7/16) AAS
>>270
c#でcsv書き出してるけど、そこでなにか設定するべきなんですかね
excelでcsvファイル作って268のコード使ってみたら、もじバケしてるけど動作はしました
286: デフォルトの名無しさん [sage] 2020/01/18(土) 16:55:44.21 ID:bny/49Iw(8/16) AAS
>>270
c#側のコードを確認したらshift-jisになっていたので、
utf-8に変更したら読み込み可能になりました。

いろいろとありがとうございました。
287
(2): デフォルトの名無しさん [sage] 2020/01/18(土) 16:59:34.12 ID:bny/49Iw(9/16) AAS
でも、shift-jisのファイルをshift-jisとして読み込もうとしても
うまくいかないものなんですね
難しい・・・
289
(2): デフォルトの名無しさん [sage] 2020/01/18(土) 18:17:17.03 ID:bny/49Iw(10/16) AAS
>>288
これはできますね。
間にエクセルを入れるとどうもおかしなことになるみたいです。
エクセルって書き出し時のコード指定できないみたいだし。
291
(2): デフォルトの名無しさん [sage] 2020/01/18(土) 18:46:21.41 ID:bny/49Iw(11/16) AAS
df_descr.to_csv('summary_data.csv', mode='a', header=False)

header=Falseなのに、データに日本語があると毎回ヘッダーが書き込まれる
pythonはutf-8で自分で書き込んでいるのに、自分で読めてないってことですよね

pythonで日本語のデータ書き込み諦めたほうがいいのかなぁ

一日本質とは違うところで悪戦苦闘して疲れ果ててきました
292
(1): デフォルトの名無しさん [sage] 2020/01/18(土) 18:59:16.48 ID:bny/49Iw(12/16) AAS
>>291

間違えました

df_descr.to_csv('summary_data.csv', mode='a', header=False)

header=False
でデータに日本語が含まれているとヘッダーが一度も書き込まれない。
なんででしょう・・・。
296
(2): デフォルトの名無しさん [sage] 2020/01/18(土) 19:10:51.11 ID:bny/49Iw(13/16) AAS
>>290
notepad上書きで解決というのも読んだのですが、バケバケ状態解決せずです。
297
(1): デフォルトの名無しさん [sage] 2020/01/18(土) 19:25:15.56 ID:bny/49Iw(14/16) AAS
>>295
あああ〜
header=False
は常にヘッダー書き込まないんでしたっけ。

csvファイルにヘッダーがなければ書き込む、ヘッダーがあれば書き込まないって設定ありませんでしたっけ?
なんかもうだんだん自分が壊れてきました。
302
(2): デフォルトの名無しさん [sage] 2020/01/18(土) 21:42:34.08 ID:bny/49Iw(15/16) AAS
>>301
いろいろありがとうございます。

頭冷やしに散歩してきて、じっくり読んだら解決しました。
これ一人だったら絶対解決できなかった。

Python数値計算とかバシバシできてるときはすごく作業効率いいんだけど、
こういうところで躓くと大量に時間を消費してしまう。
C#と勝手が違うところが多いよね。

使い続ければいいつか立派なPython使いになれるんだろうか・・・。
304
(2): デフォルトの名無しさん [sage] 2020/01/18(土) 23:13:31.82 ID:bny/49Iw(16/16) AAS
plt.text(0,0,'hello')

と座標を指定するのでなく、グラフの左上、右上などを指定してテキストを表示させることってできますか?
前次1-
スレ情報 赤レス抽出 画像レス抽出 歴の未読スレ AAサムネイル

ぬこの手 ぬこTOP 0.041s