I’m loser, baby.

So why don't you kill me?

はんかくかな、じゃぱんだ

2月に入ってから制御盤製作の仕事は一端止まって事務系の仕事を振られています。
一番のメインはこれまで弥生とエクセルでやってた会社の業務を新しいシステムに移行するためにデータベースの仕様を切ってデータをCSVに整形する業務。
6月の現システムとの並行稼働に向けて進めているんですが、小さい会社とはいえボリュームはそれなりにある訳です。

取りあえず書類の流れを教えてもらいつつ、基幹システムの操作練習のためとデータベース設計の足掛かりの為に仮の参照テーブルとダミーデータを作りつつ、元のデータの整形をしています。
元データが項目ごとに分かれていれば簡単だったんですが、商品名メーカー名型番寸法が一緒の項目にごっちゃに入っていたり、一方型番以外何も判らない部品があったりして悩ましい。
最初茶筅とかでMecabとかで楽できないかと思ったんですが上手く行かなくて、gawkが半角カナが使えるバージョンのはずなんですけれど自分の正規表現の書き方が間違ってるのかどうも上手く動いてくれなくて。結局、gawkで漢字、カナ、英字に分解してエクセルのvlookup、search、count、ifの嵐でいい加減オレ形態素解析やってたんですが、作業が進むにつれてエクセルが重くなってきて、ついに今日落っこちて40分分の作業が消えた、むしろ40分で済んでよかった。

そろそろいい機会だしpythonでやったほうが良いかなとか思ってちょっと調べてエクセル扱うんだとpandasが良さそうだと思ったんですが、更に半角カナまで考慮されてるjapandasってのがあるんですね。ありがたい!!
sinhrks.hatenablog.com
pythonって仕事の道具としてはかなり優秀(その仕事のためのモジュールが大抵ある)と聞いていたけど、確かにそうかも。これでpythonをやる動機が自分の無意識の腑に落ちたというか、今年はきちんとpythonできそうな気がする。

ついでに調べたjupyterとnotebookの組み合わせも楽しそうだ。オライリーの本の目次見たら凄いワクワクした。

データ分析、解析がメインでビッグデータ系の話も多いんだけれど、11章の中に

  • レシピ 11.6音声へのデジタルフィルタ適用
  • レシピ 11.7 notebook上のシンセサイザー作成

があるのがまたグッとくる。もう少しpythonやったら買おう。

QB64の方は、プログラム組むよりQB64で遊びながら自分の作りたい音楽ソフトの仕様を頭の中で考える時間が長いんだけど、当初、凄い大きさの配列が必要になりそうで、なんぼ爆速のQB64でも厳しかろうと思って解決方法を考えていたんですが、昨日風呂入ってる時に上手い解決法を思いついたので、あとは順番に書いていけば良くなりました。あ、でも、構造体の使いどころがまだ上手く思いついてないや。