日本酒醸造管理データモデルを公開した思惑と展望

昨年Rubygemsで日本酒醸造管理データモデル「Toji」を公開した。
その意図と目的がミスリードされがちなので、思惑と展望についてつらつらと。

https://rubygems.org/gems/toji

デジタル化する目的とは

連絡を取ってくる蔵の人と吉田とでは、デジタル化の意義の解釈が根本的に違うんだろうなと感じる。
この解釈の差は大きい。

Tojiに興味を持つ蔵の人の思惑。
・温度やアルコール度数など入力するだけでグラフ化したい。
・経過簿から自動でBMD曲線やAB直線をグラフ化したい。
・楽をするためにIoT化したい。
・エクセルで管理したい。
→人間が楽をするため。

吉田の思惑。
・温度やアルコール度数などの1次データを分析出来るようにフォーマット整えたい。
・整形された1次データをグラフ化したい。(つまり経過簿)
・1次データのみを用いて計算できるものをグラフ化したい。(つまりBMD曲線やAB直線)
・解像度の高い1次データをリアルタイムに蓄積するためにIoT化したい。
・解像度の高い1次データを元に高次元分析をして統計を取ってABテストを繰り返して理想の酒質に近づけたい。(要は獺祭がやってるようなこと)
・膨大なデータを蓄積して分析するためにデータをクラウドで管理する必要がある。
→人間には出来ない計算をするため。

醸造管理データモデルの公開

吉田の思惑を言い換えれば、蔵の経過簿等の管理をデジタル移行するにあたっての課題でありマイルストーンでもある。

そのファーストステップとしてまずはフォーマットを整えましょう、と。
しかし全国の各蔵でよく使われている紙の経過簿フォーマットに相当するものがデジタルにはなかった。
そこでデータモデルを設計してオープンソースで公開したものがToji gems。
これを醸造管理データモデルのスタンダードとしませんか、という提案。

MIT Licenseで公開してるからライセンスのもと好きに使ってくれて構わない。
そのまま使うも良し、エクセルで管理したいならエクセルに移植するも良し。

とは言っても、田舎のおじいさんがこれを使うのは無理でしょう。
ではなぜ公開したのか。
それはこのデータモデルに準拠したシステムを世の中の複数のベンダーに作ってほしいから。

システムに依存せずデータモデルに準拠すべき

共通のデータモデルを使ったシステム同士であればデータをエクスポート/インポートして直ちに移行が完了することも容易になる。
データモデルを公開し標準化することで、このデータモデルに準拠したシステム同士ではデータの移行コストを大幅に減らすことができる。

蔵にとって、共通のデータモデルで複数のベンダーがシステムを作るメリット。
・蔵がどのシステムを使うかの選択肢が増える。
・システム移行のコストが減るので時代と目的に合わせて最適なシステムを選択し続けることが出来る。

「最適なシステムを選択すること」ではなく「最適なシステムを選択し続けること」なのがポイント。
当たり前のことだけど、今最新でモダンな設計のシステムを導入したとしても10年後には10年前の古いシステムになる。
だからその時代に見合ったものをどこかのベンダーが作ればいいなと思っている。
蔵の事業なんてこの先ウン百年も続くんだから、目先の導入のしやすさや手軽さではなく、そのシステムが古くなった時のことを想定した方が良い。
簡単にやめられないシステムを使うとなると、導入するにあたってそのシステムと一生添い遂げるような気概が必要になってしまう。
そうならないためにシステムやツールに依存するのではなくデータモデルに準拠すべき。

データモデルの発展と展望

醸造管理システムを新たに作りたいベンダーが現れた場合。
システム移行が容易なため参入障壁が下がり、より良いシステムが誕生しやすくなる。
蔵からすれば、移行コストを考えずに機能、操作性、価格などを比較しその時代時代でより自分に適したシステムを選ぶことができる。

醸造データを分析したいベンダーが現れた場合。
データモデルが決まっているので実データがなくてもインターフェイスを合わせて開発することが出来る。
世の中には、なんでそんな研究してんの?みたいな一見無意味でニッチな探究心を持った有能な変人が結構いる。
そういう人が斜め上から価値をもたらすことも往々にしてある。
そういう人を取りこぼさないためにも研究できるようにデータを整えておくことは価値がある。
(誰彼構わずデータを明け渡すという意味ではなく、いざ他人にデータを提供しようとした時に紙で渡されても困る、という話)

共通のデータモデルに準拠したシステムを使う蔵同士であれば、蔵をまたいだデータ分析ができるようになる。
ひとりの人間が生涯かけても統計学で有効なサンプル数を取ることは難しい。
例えば、70年勤続して年間20仕込みする蔵に従事していた場合1400、年間30仕込みで2100。
原料が限られているにも関わらず多くのファクタが存在する日本酒醸造においてこのサンプル数は統計学上あまりにも少ない。
あの獺祭であっても山田錦1本に絞って何年も四季醸造し続けて今がある。
蔵をまたぐデータ分析は統計学上有効なサンプル数が賄えない小さな蔵にとっては大きなメリットになる。

デファクトスタンダードへの障壁

しかしこのデータモデルがデファクトスタンダードになるためには大きな障壁がある。
それは、システムに対してビタ一文金を払う気がない蔵が多いという点。
蔵が金を払う気がない、ベンダーは儲からないからどこもシステムを作らない、市場として競合が生まれず技術的な進歩をしない。

一切金にならないのにこれだけの開発をしている吉田が特殊なだけ。
データモデルを無償公開しているからと言って、どうやって使うのかわからないからタダでサポートしてほしい、タダで蔵独自のシステムを作ってほしい、タダでデータ入力してほしい、みたいなズレた要望をされて嘆かわしい。
往々にして田舎の小さな蔵はいろんな人がボランティアで至れり尽くせりやってくれて、そのへんの感覚が世間離れしてるのかなとも思う。
将来的な展開を見据えている蔵は既に何かしらの管理ツールは導入しているだろうし、未だに紙で管理している蔵なんてそんな感じなのかもしれない。

日本酒蔵が舞台の映画で、酒質よりも効率化と利益を優先する血も涙もない東京モンが悪役の話があったけど「楽をしたいからタダでシステムを作って欲しい(要約)」と言ってくる蔵がある、これが現実。

もう少し数学に理解を示してほしい

実作業にあたる蔵人に求められる学力って小学5年生レベルなんじゃないかと思う。(煽り)
・体積の計算
・濃度の計算
・水温の計算
くらい出来れば事足りる。

杜氏(微生物学や化学の人)がどんな小難しいことを考えているのかこっち(数学の人)からはよく知らないけど、もう少し数学にも理解を示してほしいなと感じる。
現代の蔵元や杜氏と呼ばれる人ってだいたいどこかの大学の醸造学科を出てると思うけど、数学はやらないんだろうか。
線形代数とかって大学数学の基礎のはずで、そこらへんの勉強をしていれば統計学の意義がわかると思うのだけれど。

効率化や楽をすることを目的としていない

冒頭に書いたけど、人間には出来ない計算をすることを目的としている。
データモデルを定義してフォーマットを整えるのは、人間には出来ない計算をするための前提。
その前提を整えればBMD曲線やAB直線をグラフ化することも容易いというだけのこと。

デジタル化の真価はデータを分析することにある。
断じて1次データから電卓を使って求められる程度の計算をして2次元グラフ(BMD曲線やAB直線)を表示させることではない。
データの分析とは、グラフで表すことの出来ない高次元データを扱うということ。

正直、電卓で計算出来る程度のことしかしないなら、別に紙でもいいと思う。
BMD曲線やAB直線をグラフ化したいというだけなら、近所の高校生を安く雇ってエクセルで適当にやってもらえばいいんじゃないかと思う。

お問い合わせの仕方

Toji gemsについて問い合わせてくる蔵の人って、現状の蔵の管理方法よりも吉田の管理手法の方が優れていると感じたから連絡をしてきたはず。
言ってしまえば自分の蔵のデータさえもまともに管理出来ていない人。
そんな人がこっちのデータモデル設計に対して謎の上から目線でアドバイスをしてきたりするのでなんだかなぁと。

大体のアドバイスはデータモデルではなくシステムに関して「自分が必要としているから作って欲しい」という言い分。
であれば手法に対してとやかく言うのではなく、蔵の抱える問題点や経緯、目的などを共有してほしい。
・困りごとがあるのであれば、現状どういう管理をしていて何が問題になっているのか。
・蔵独自の管理手法をそのままデジタル移行したいというのであれば、その管理手法は何を目的としていてどのように優れているのか。

誰かひとりが必要としても汎用的に優れていない手法を採用する気はないし、金銭が発生しない以上やるやらないはこちらの一存。
タダで作らせたいのであればプレゼンテーションする立場だと理解してほしい。

敬意も金も払わんとなるとどうにもならん。
足元を見られる筋合いはないので何卒。