論文を書きまくるには効率化を図らなければいけないが、一定の時間がかかる。
では論文を1本仕上げるのにどれくらい時間がかかるのだろうか。
かなり色々な要素によるのだが、原著論文一本仕上げるのには
大体40-150時間くらい
かかるのではないだろうか。
3000語程度の書き物に100時間以上かけて、お金がいっぱいもらえるとか何かいいことがあるに違いないと思うかもしれないが
特にいいことはない。
それでも論文書く人たちへ…
時間のかかり具合の要素としては
- データが既に存在するか
- 仮説とデザインの煮詰まり具合
- 解析のスピード
- 論文英語のレベル
といったところだと思う。
そして時間をかけた論文が必ずしも高インパクトに仕上がるとは限らない。
むしろ勢いのある爆進していったプロジェクトの方が、ゆっくり煮詰めていったものより出来が良かったりする。
僕の最短は30時間強の原著論文で、他のプロジェクトから派生したものだったのでアイデアも固まっていたしデータもあったので勢い良く進んで出来も僕の書いたものの中では良い方だった。
学生の頃に手掛けた長い、泥沼にはまったもので大体200時間くらい。これはたくさんのジャーナルから蹴られまくった挙句インパクトファクター1ちょっとの底辺ジャーナルに落ち着いた。
上記の4つによって変化する時間を抑えていけば効率化につながると思う。
1. データが既に存在するか
これはスタディーデザインと親密に関わっているのだが、もちろんデータが既に存在する場合とデータ集めから始めなければいけない場合なら前者の方が絶対にいい。
結局のところ、論文は検証可能な事象(データが採れる・存在する)の枠に収まらなければいけないので、超重要なリサーチクエスチョンがあったとしてもデータが採れるデザインに落とし込まなければいけない。そしてその過程で元々検証したかったリサーチクエスチョンからどんどん離れていってしまうことも少なくない。
なので、ある程度リサーチクエスチョンが固まっているものを既存のデータに当てはめて妥協しながらリーズナブルな労力で検証可能なものにすることは自然なプロセスだと思う。
変数がしっかり定義されている既存のデータベースの例えはこちら。
無料で公開されているデータも上手く使えばかなり良い論文が書けると思うので(実際かなりの数の高インパクト論文が一般公開されているデータから書かれている)、初期投資として、どういったデータベースが存在するのかを勉強するのはオススメ。
2. 仮説とデザインの煮詰まり具合
これは本来なら大前提であるべきステップだが、ある程度データベースの型とサンプル数がわかっている状態にならないと、どういった仮説が検証可能で統計的に有力な解析ができるかどうかが分からないことは多いと思う。
なのでサンプル数の見当が全くつかずにデータベースを構築しなければいけない場合、泥沼にハマるリスクは覚悟しなければいけないし、サンプル数が少なすぎるとわかった時点でプロジェクトを中止して損切りする決断のは大事だと思う。サンプル数についてはまた書きたいが、スタディーが上手くいくかどうかの最重要ファクターだと思う。
そういった理由で僕は最近は既存データベースを使うようにしている。
3. 解析のスピード
ほとんどの後ろ向きの効果比較研究は、かなりファンシーな統計手法に手を出さない限りは一つのテンプレートで解析ができると思う。
なのでそのテンプレートが出来上がっているかどうか、またそのデータベースの変数用のコードが存在しているかどうかで結構時間が変わってくる。
なのでコードのテンプレートを作りにくい解析ソフトはあまりオススメしない。JMPなどがこれにあたるのではないだろうか。
僕はSAS, R Studio, Jupyter のPython を必要に応じて使い分けている。
また、データベースを変える度に新しいデータベースの性質を勉強してクリーニングのコード、新しい変数の名前に合わせたコードを書かなければいけないので僕は一つのデータベースに慣れたら3−4本くらいは書こうとする。せっかく時間をかけてデータベースの詳細を学んでコードも書いたのだから、その知識が活きて比較的簡単になる2本目3本目へといきたくなってしまう。
もっと言えば、最低数本は書ける目処の立つデータベースじゃないと手を出さない。
4. 論文英語のレベル
これは慣れるしかないと思う。ネイティブでも論文を書いたことのない学生に書かせると全部書き直しになることは多いので、筆記英語力云々の問題だけではないと思う。もちろんリライトサービスやかなり使える校正ソフトが存在するのでここは工夫で乗り越えられるポイントではないだろうか。
まとめ
原著論文1本書くのにはどうあってもかなりの時間がかかる。
研究チームが上手く機能している場合はタスクを分担して効率よくプロジェクトを進められるが、データベースに関する知識とサンプル数に大してシビアにアプローチするのことでかなりの泥沼プロジェクトを回避できると思う。
統計ソフト、コード、執筆は全て、一通り全ての手順を踏んで見て自分のテンプレートを作るのが効率化の第一歩なのではないだろうか。
One thought on “論文1本書くのに何時間かかる?”