CSVファイルのスレ (296レス)
1-

1
(2): 名無しさん@お腹いっぱい。 03/07/02 17:58 ID:??? AAS
おそらく一番簡単なデータベースと思われるCSVファイルについていろいろ語りましょう。
247
(2): 2015/12/04(金)15:14 ID:SUaZoleF(1) AAS
ある基幹システムにcsvからデータをインポートする作業があるとして
そのcsvデータが取り込み形式に合っているかどうかのチェックをしたいんですが
どういった方法が一番いいですか?

チェックしたいのは、
・項目の並びが正しいか
・各項目に不整合な形式のデータがないか
 (例えば、日付データの場所に文字列とか)

よろしくお願いします。
248: 2015/12/04(金)20:13 ID:??? AAS
コマンドラインでどうかな?
外部リンク[rb]:github.com
249: 2015/12/06(日)02:03 ID:??? AAS
>>247
grepにかける
250: 2015/12/12(土)20:58 ID:X9wcWIIa(1/2) AAS
>>247
Excelにインポートしてチェックする。

プログラム作ってチェックする。
251: 2015/12/12(土)20:59 ID:X9wcWIIa(2/2) AAS
なんでCSVファイルのことがデータベース板にあるのか。
252: 2015/12/22(火)17:51 ID:M/D0CZ4+(1) AAS
いろんな情報のデータベース板と思えばいい
253
(1): 2015/12/22(火)18:01 ID:??? AAS
それだと何でもありじゃないかw
254: 2015/12/29(火)00:36 ID:??? AAS
>>253
なんにもないよりは良い
255: 2016/02/04(木)15:04 ID:vrajJNnU(1/2) AAS
ExcelとしてはTSVファイルの方が相性がいいのに、なんでみんなCSVにこだわってるんだろうか。
256
(1): 2016/02/04(木)15:19 ID:??? AAS
TSVもCSVの一種として扱ってるのにわざわざ区別する奴はなんなんだろう
257
(1): 2016/02/04(木)21:19 ID:vrajJNnU(2/2) AAS
>>256
何を言ってるのか?
258
(1): 2016/02/14(日)03:11 ID:??? AAS
>>257
TSVもCSVのうちという話じゃないの?
259
(1): 2016/02/14(日)05:31 ID:bY+ncSXr(1/2) AAS
>>258
あほか。
260
(1): 2016/02/14(日)13:59 ID:??? AAS
名称としてTSVなんて一般的じゃない
タブで区切ったCSVという呼び方のが通じるw
261
(1): 2016/02/14(日)19:02 ID:bY+ncSXr(2/2) AAS
>>260
馬鹿丸出し
262: 2016/02/14(日)22:32 ID:z/fFeDUz(1) AAS
>>261
昔はメールと言ったら手紙のことだったが、
インターネットが普及するのにしたがってメールは電子メールのことを
表すようになった。つまり、タブ区切りこそが真のCSVである。それでいいな?
263: 2016/02/15(月)13:12 ID:fwBBCAc8(1) AAS
マ イ ン ド コ ン ト ロ ー ル の手法

・沢山の人が、偏った意見を一貫して支持する
 偏った意見でも、集団の中でその意見が信じられていれば、自分の考え方は間違っているのか、等と思わせる手法

・不利な質問をさせなくしたり、不利な質問には答えない、スルーする
 誰にも質問や反論をさせないことにより、誰もが皆、疑いなど無いんだと信じ込ませる手法

偏った思想や考え方に染まっていたり、常識が通じない人間は、頭が悪いフリをしているカルト工作員の可能性が高い

靖 国 参 拝、皇 族、国 旗 国 歌、神 社 神 道を嫌う カ ル ト
省2
264
(1): 2016/02/20(土)23:08 ID:??? AAS
>>259
character separated values
で検索してみるといい
265
(1): 2016/02/25(木)08:01 ID:??? AAS
>>264
それ知ってるけど、そういうのも含めて、一回csvって絶滅しねーかな。
csvのうち、セパレータがタブのものはtsvっていうなら、セパレータがカンマのはなんて呼ぶんだ?

絶滅後に、もう一回仕様をきっちりしてほしいよ
266: 2016/05/01(日)23:24 ID:??? AAS
>>265
すでに一回絶滅したよ
そしてRFCが出来た
267
(1): 2016/05/23(月)12:53 ID:WNFQzXcv(1) AAS
初めて業務でcsvファイルを扱うことになり(ちょっとした雑務程度ですが)
open officeを今使っているのですが、

ある列(縦)のデータ(Aとします)と、
ある列のデータ(Bとします)の二つを抽出して、

そのデータを両方とも降順を昇順にして
Aのデータ(x1,x2,x3...)に、Bのデータ(y1,y2,y3...)を加えて
ABのデータ(x1,y1,x12,y2,x3,y3...)にして、
そのデータを他のデータに追加したいです。

事務作業をやったことがこれまでにないので、
どうか心優しい方教えて下さいましたらありがたいです。
268: 2016/05/23(月)12:54 ID:??? AAS
>>267
教えてほしいのはやり方です。
宜しく御願いいたします。
269: 2016/05/23(月)13:33 ID:UP9ZYRKE(1) AAS
何を言ってるのがわからないうえに、Excelの操作ならExcelのスレッドで聞いた方がいい。
270: 2016/07/10(日)01:29 ID:??? AAS
オッペンオフィスを使っているのか、
(会社がせこくて無料の)オッペンオフィスを使わされているのか。
271: 2016/07/17(日)20:38 ID:??? AAS
Now, I am become Death, the destroyer of world
272: 2017/12/29(金)11:38 ID:dtNZwIie(1) AAS
誰でも簡単にパソコン1台で稼げる方法など
参考までに、
⇒ 『宮本のゴウリエセレレ』 というブログで見ることができるらしいです。

グーグル検索⇒『宮本のゴウリエセレレ』

L1WOEFDH6U
273
(1): 2019/08/18(日)01:01 ID:??? AAS
Cassava Editorっていまもまだ更新続いてるのか・・・
現在進行形で10年以上、更新が続いているってすごいな
作者尊敬するわ
274: 2019/09/05(木)20:35 ID:DlL3ZhYX(1) AAS
>>273
あすかぜさんは神

あすかぜさん無しでは生きていけない
275: 2019/09/13(金)00:27 ID:JsZ81e/N(1) AAS
Cassava Editorが存在することで日本の生産性が向上していることは間違いない
276: 2020/05/13(水)11:02 ID:??? AAS
幾度ものタピオカブームの浮き沈みも関係なく
cassava editorは進歩する
277: 2020/05/14(木)13:55 ID:??? AAS
SUMとかAVERAGEとかの基本的な関数だけでも実装してくれたらなぁ。。
278
(1): 2020/07/04(土)23:14 ID:pcZg9qmx(1) AAS
「Cassava Editor」外部リンク:www.asukaze.net v2.2.0 (2020/07/04)
64 bit 版を追加。
マクロファイルの文字コードを Shift-JIS から UTF-8 に変更。
ただし、UTF-8 として読み込めない場合は Shift-JIS として解釈される。

これぞ最強・最速・最高性能
279: 2020/07/09(木)10:48 ID:IGkzCBkT(1) AAS
>>278
あざーす!
280: 2020/12/23(水)01:22 ID:??? AAS
CSVはRFCに従うよりエンマークでエスケープした方がLinuxで使いやすい

RFCとは別にPOSIXのCSVとしてエンマークエスケープのCSVが普及して欲しいと思う今日この頃
281: 2021/10/08(金)19:00 ID:??? AAS
ASCIIセパレータのことも思い出してあげてください
282: 2022/07/17(日)23:11 ID:/HVWy/+u(1) AAS
制御文字は人間に優しくないのがつらいんよねー
システマチックに使うだけなら良いかも
283: 2022/09/03(土)22:15 ID:euVNIg62(1) AAS
Twitterで100GBのCSVを10GBのメモリのPCでソートするにはどうすればよいかって話題になってた
どうやればよいのだろうね
284: 2022/09/05(月)13:23 ID:??? AAS
死ねばいいんじゃないんですかね
そういうシステムを作っちゃうやつは必ず同じ失敗を繰り返す
285: 2022/09/05(月)13:49 ID:Tc12+IoI(1) AAS
システムの良し悪しじゃなくてDBに入れるとかそういう具体的なやり方の話をしたかった
286: 2022/09/05(月)22:33 ID:??? AAS
CSVは基本可変長レコードだから、ファイルへのランダムアクセスでデータが取り出せない
それだけでソート行うのに不適ってわからない時点でもうダメ
データの入れ替えもとんでもなく困難

ファイルを固定長にするという発想があれば
ソートも入れ替えも比較的容易に出来るんですがねぇ…
あとはメモリ使用量の少ないソートアルゴリズムを選べばいい
287: 2022/09/08(木)13:59 ID:ZUZFeHFR(1/2) AAS
だめだこりゃ
288: 2022/09/08(木)14:00 ID:ZUZFeHFR(2/2) AAS
イキりマンがいるとダメだ
289: 2022/09/08(木)23:42 ID:??? AAS
まさかcsvのソートができないなんて上から目線で言うやつがいるとは思わんかった。
290: 2022/09/09(金)10:39 ID:??? AAS
ではイキリマンとは違う事を
正解を示すことで証明していただきたい
291: 2022/09/09(金)21:39 ID:??? AAS
ふふふそうはいかない
お前に利は与えぬ
292: 2022/09/09(金)23:06 ID:ybJikvqo(1) AAS
ふふふ
293: 2022/09/11(日)01:48 ID:Mo970C1D(1/2) AAS
ソートするだけならマージソートでやれば良い
マージソートはレコードをシーケンシャルに読み書きしていくだけで良い

CSVが100GBで、1レコードが1KBだと仮定するとレコード数は1億
log2(1億) = 26.5
27回はスプリットとマージを繰り返さないといけない
100GB * 27 * 2(読みと書き) = 5400GB
ストレージの読み書き速度が500MB/sだとして3時間

性能要件的に3時間が是か非か

SQLiteやPostgreSQLにデータを入れてSQLでソートするにしても
DBではデータがノーマライズされるうえにインデックスも構築されるから
省10
294: 2022/09/11(日)02:08 ID:Mo970C1D(2/2) AAS
10GBに収まるギリギリまでメモリ上でソートすればいいので27回も繰り返す必要はないのか
ストレージ上のデータがメモリ上では10倍になるとしてメモリ上でソートできるのは100万レコードくらいかな
100万レコードが100個できるとして
log2(100) = 6.6
100GB * 7 * 2(読みと書き) = 1400GB
ストレージの読み書き速度が500MB/sだとして47分
結構速いな
295: 2023/05/24(水)21:48 ID:??? AAS
Excel365で開くと、最初は問題なく開けるのに、
しばらく使ってから開くと文字化けするのはなに?
文字化けするファイルもしないファイルも文字コードは同じ
PC再起動すれば一時的に直るけど、またしばらく使ってると再発する
296: 2023/06/03(土)19:09 ID:WlpZXlkv(1) AAS
BOMが消されてるんじゃない?
1-
スレ情報 赤レス抽出 画像レス抽出 歴の未読スレ AAサムネイル

ぬこの手 ぬこTOP 0.019s