Anaconda で ROOT 入れたり

Anaconda 環境に ROOT を入れるときのメモ。1 年前に Mojave でやったときとちょこちょこ変わっているので、2020 年 6 月現在の以下の環境を想定。

  • macOS 10.15.4
  • Xcode 11.5
  • CMake 3.17.1(conda ではなく Homebrew から)
  • Anaconda3-2020.02-MacOSX-x86_64.sh

まず、Mac 用の Anaconda を落としてくる。 https://repo.anaconda.com/archive/Anaconda3-2020.02-MacOSX-x86_64.sh

適当に答えて進める。

$  chmod +x Downloads/Anaconda3-2020.02-MacOSX-x86_64.sh
$ ./Downloads/Anaconda3-2020.02-MacOSX-x86_64.sh

自動的に .zshrc に Anaconda の設定が書き込まれるのが好きじゃないので、自分の場合は関数で括って好きなときにAnaconda 環境に入るようにしている。

conda_init(){
# >>> conda initialize >>>
# !! Contents within this block are managed by 'conda init' !!
__conda_setup="$('/Users/oxon/anaconda3/bin/conda' 'shell.zsh' 'hook' 2> /dev/null)"
if [ $? -eq 0 ]; then
    eval "$__conda_setup"
else
    if [ -f "/Users/oxon/anaconda3/etc/profile.d/conda.sh" ]; then
        . "/Users/oxon/anaconda3/etc/profile.d/conda.sh"
    else
        export PATH="/Users/oxon/anaconda3/bin:$PATH"
    fi
fi
unset __conda_setup
# <<< conda initialize <<<
}

4.8.3 に update する。

$ conda_init
(base) $ conda update -n base -c defaults conda

好きな環境、例えば sstcam_root という環境を作る。このとき、-c conda-forge で channel を指定する必要あり。ROOT はここにあるので。

(base) $ conda create -n sstcam_root root -c conda-forge
(base) $ conda activate sstcam_root
(sstcam_root) $ which root.exe 
/Users/oxon/anaconda3/envs/sstcam_root/bin/root.exe
(sstcam_root) $ root
root [0] .q

以前は MacOSX10.9.sdk とかを落としてくる必要があったのだけど、今は要らなくなった。なので、Anaconda 側で Xcode についてくる SDK を勝手に環境変数に設定してくれる。これは base のときは空っぽで、次のように ROOT 環境のほうだけ。10.15 が指定されている。

$ conda_init 
(base) $ echo $CONDA_BUILD_SYSROOT

(base) $ conda activate sstcam_root 
(sstcam_root) $ echo $CONDA_BUILD_SYSROOT 
/Library/Developer/CommandLineTools/SDKs/MacOSX.sdk
(sstcam_root) $ ll $CONDA_BUILD_SYSROOT
lrwxr-xr-x  1 root  wheel  15 Mar 25 11:24 /Library/Developer/CommandLineTools/SDKs/MacOSX.sdk -> MacOSX10.15.sdk

これで、ACLiC も問題なく動く。ACLiC を動かすためにも、以前は SDK を自分で用意する必要があった。

(sstcam_root) $ root
root [0] .x aho.C+
Info in <TMacOSXSystem::ACLiC>: creating shared library /Users/oxon/./aho_C.so

Anaconda で入れるものではない library を CMake で build するとき、引数を追加する必要がある。

docs.conda.io ここを読むと、次のようにやる必要があるらしいのだけど(これは clang が Anaconda 環境のものが使用されてしまうため)、

(sstcam_root)$ cmake ../source -DCMAKE_INSTALL_PREFIX=$CONDA_PREFIX -DCMAKE_OSX_SYSROOT=$CONDA_BUILD_SYSROOT

実際には次のコマンドでちゃんと動いた。CMake のバージョンによるのかもしれない。

(sstcam_root)$ cmake ../source -DCMAKE_INSTALL_PREFIX=$CONDA_PREFIX

SYSROOTROOT は ROOT と関係ない。

この環境で例えば他に Python 関係のものを追加したい場合、conda-forge から入れるようにする必要がある。

(sstcam_root) $ conda config --env --add channels conda-forge
(sstcam_root) $ conda install scipy astropy matplotlib tqdm pandas numba cython scikit-learn

Studio.app と LDraw を使って LEGO 風のイベントディスプレイをスーパーカミオカンデ用に作る

同業の中の人がこんな企画をされていました。

あくまで一般向けのものであって、同業者が手を出すものではないと思うのですが、Python + matplotlib よりも ROOT だと早いよ、というのを言いたくなってしまったので、大人気ないことをしてしまうわけです。

さて、以前から LEGO ブロックで物理関係のことをやってみたいなとずっと思っていて、また LEGO の 3 次元データを扱うためのファイルフォーマットの 1 つである LDraw というものを最近知りました。LDraw のフォーマットは非常に簡単なので、これを使うとイベントディスプレイに使えます。
www.ldraw.org

また Studio.app という LEGO(風の)ブロック用の 3D ソフトウェアもあることを知り、これで LDraw をインポートできるということもわかりました。じゃあ、これらを組み合わせるとスーパーカミオカンデ(SK)のイベントディスプレイを LEGO 風にできるわけです。
www.bricklink.com

本当は SK ではなくて、自分のやっているチェレンコフ望遠鏡アレイ(CTA)のイベントディスプレイで遊ぶべきなのですが、同業の中の人の企画にまず乗っかってみようかな、と。

さて、結果です。

ROOT で 5 行で作る場合
$ root
root [0] TNtuple nt("nt", "nt", "ch:pe:t:x:y:z")
root [1] nt.ReadFile("Downloads/sample/multirings.0001.000015.csv")
root [2] nt.SetMarkerStyle(20)
root [3] nt.SetMarkerSize(0.5)
root [4] nt.Draw("z:y:x:pe", "", "col")

f:id:oxon:20200531121653p:plain
ROOT の NTuple で作ったもの

ROOT + Python で LDraw に出力したもの
$ ./sk2lego.py Downloads/sample/multirings.0001.000015.csv > event.ldr

f:id:oxon:20200531121744p:plain
LDraw に出力して、Studio.app でインポートしたもの

LDraw の形式は、こんな感じです。1 に続けて、色番号、座標と回転行列の要素、そして部品番号です。簡単ですね。

1 36 x y z Rxx Rxy Rxz Ryx Ryy Ryz Rzx Rzy Rzz 4073.dat

まあ、これだけだと実際に立体に組むことはできないので、東大 LEGO 部の作品に組み込むと格好良さそうな気がします。
http://www-sk.icrr.u-tokyo.ac.jp/pr/topics/2016/08/img/DSC_0984%20copy.jpg

sk2lego.py の中身です回転行列を使う必要があるので、それは ROOT を呼んでいます。

gist.github.com

愛知・岐阜県内 329 人の感染経路を可視化してみた

記事のタイトルは、9 年前の自分の記事からの「インスパイア」です。あの頃は、放射線量の時間変化や、空間分布を作っていました。福島県に親戚が住んでいたからです。いつでも逃げられるように、定量的な判断基準を持つための資料が必要でした。
oxon.hatenablog.com

雑感

今回の新型コロナウイルスでは、誰から感染するかも分からないし、逆に感染させてしまうかもしれないし、日本中、世界中のどこに行っても「逃げる」というのは困難です。自分一人が感染を防いでも社会全体の流れを止めることはできず、全員が同じように感染防止を目指さないと、逃げたくても逃げられないという、大変困難な状況です。我が家は自主的に保育園の利用を停止したり、小学校の始業式をサボったりしていますが、うちだけやったところで社会の流れを止められるわけもなく、焼け石に水と思いながら行動しています。

さて、毎日コロナのニュース、特に名古屋大学のある愛知県のニュースを観ていても、「本日は新規感染者が XX 人」とか「YY で起きた集団感染の濃厚接触者」とか 、そんな断片的な情報ばかり入ってきて、全然可視化できない。何が起きているか、頭の中で考えられない。どの集団感染がまだ続いているのか収束したのか把握し続けられない。合計感染者数の時間変化のヒストグラムを眺めても、はたして愛知はどういう状況かというのがちっとも分からない。そういう不満がありました。そこで、9 年ぶりに手を動かしてみることにしました。

図から分かること

愛知県は初期に感染者の急増があったのですが、その後増加が緩やかになりました。これを合計感染者数や、日毎の新規感染者数のヒストグラムで眺めていると何が起きているか見えませんでした。

(専門家や追いかけている人たちは知っていることでしょうが)今回の図で、2/14 と 2/29 に始まった初期の集団感染 2 件(スポーツジムとデイサービス)が関係者の努力で収まり、3 月上旬から感染経路不明の「孤発」事例が出続けているということが、よく見えてきました。感染防止や対策が徹底されていなかった頃の集団感染は仕方がないとして、やはり孤発事例が頻発し始めた時点で強い対策を取らないと、一気に広がるのだということが分かります。

3 月末からは岐阜県でも孤発事例が増え始め、愛知県警や岐阜シャルムの集団感染を除けば、感染経路不明のものが毎日 5〜10 件出るようになってしまいました。これは東京の 2 週間前と変わらない状況なので、自粛ムードの強くはなかった東海エリアでは、この先 2 週間で増え続けると覚悟する必要があります。

愛知の人口でも初期クラスターから感染経路不明の増大へ、という流れがはっきり見えるのですから、東京・大阪の大都市圏では、やはり「クラスター対策をすれば大丈夫」なんていうのは専門家の認識が甘かったということかと思います。もちろんクラスター潰しと追跡調査をするのは絶対に必要ですので、関係者の努力は大変ありがたいことです。しかし、あまりに感染力が強すぎた。追えない事例が多数出てしまう。それが今回の COVID-19 の大変なところであり、専門家ですら対策できると過信してしまった原因なのではないでしょうか。

このような感染の拡大は、おそらく愛知や岐阜に限ったことではないでしょう。まだ感染者の少ない小中規模の都市でも、気持ちを緩めていると孤発事例が徐々に増えていき、「あれ、もしかして危ない?」と思い始めた頃には後手後手の対応に回ってしまうということが起き続けるでしょう。

可視化したいもの、やりたいこと

  1. 感染者数の時間変化(それだけなら他にいくらでも転がっている)が終えること
  2. 集団感染なのか孤発事例なのかの切り分けができること
  3. 感染経路不明の事例の時間変化が一瞥して分かること
  4. 帰国者や外国籍が分かること
  5. 個々の集団感染がどのように広がり、収束したのかどうか、今も拡大し続けているのか分かること

以上の条件を満たすにはどうすれば良いかを検討し、普段は CERN の ROOT というデータ解析ライブラリを使うのですが、今回は Graphviz を使うことにしました。
www.graphviz.org

実際にどうやるか

Graphviz は複数のノード(node)をエッジ(edge)で接続し、うまいことグラフを描画してくれるソフトウェアです。ここで言う「グラフ」は、ネットワーク図などグラフであり、数学用語のグラフです。

何百人もいる感染者をノードとして配置し、感染者同士の接触をエッジとして表現するのは、手動でやるのは困難です。少なくとも何週間かは毎日この作業を継続する必要があると判断し、Graphviz で自動化することにしました。簡単に自動化できるだろうと踏んでいたのですが、実際は手動での微調整でかなり作り込んでやる必要がありました。

Graphviz をそのまま使うのではなく、CSV ファイルを Python で読み、Python 内で graphviz モジュールを利用することにしました。

graphviz.readthedocs.io

多数の感染者情報を自治体発表の HTML や PDF から収集するのは非常に大変なのですが、東海 3 県に限っては中京テレビが機械可読性の非常に高いデータ整理をしてくれていました。原発のときは文科省福島県の測定データを自分自身や有志の多くの方のご協力で Google Spreadsheet に手入力し、可視化も自分でするという作業をしていたので大変だったのですが、中京テレビのお陰で今回はその点、とても楽です。
www.ctv.co.jp

Graphviz で苦労したところ

日付を縦方向に揃える

Graphviz の基本的な考え方は「自動で全てのノードをいい具合に配置する」です。そのため、細かいノード位置の調整を人間がして、エッジだけ自動的に描かせるという思想にはなっていません。しかし今回は、ある日付に陽性確定した感染者を時系列で並べたいため、同じ陽性確定日の感染者は縦に整列させる必要があります。

そこで、今回は subgraph と rank という機能を使って、同じ陽性確定日の感染者は無理やり横位置を揃えることにしました。この場合、Graphviz は横位置を揃える作業は死守してくれるようです。例外なく、ちゃんとノードを揃えてくれました。

好きな場所に文字列を置けない

凡例や注意書きなど、グラフ中に多数のテキストを配置する必要がありました。しかし、調べた限りではそのような機能がありません。また Graphviz の描画エンジンとして dot を使用する場合、座標の指定なんかもできないようです(いくつかの描画エンジンを選べるが、前述の rank は dot で使える)。

そのため、図中の様々なテキストは、多数のノードを追加するという無理やりな手法をとっています。加えて、ノードの中に書き込むテキストは、テキスト中心位置とノード中心位置が同じになります。そうすると文字列を左揃えにすることができなくなるため、全角スペースを多数挿入するという荒技を使っています。

s.node('author', label=' ' * 25 + 'データ出典:https://www.ctv.co.jp/covid-19/person.html\n' + ' ' * 28 + '作成:@AkiraOkumura(名古屋大学 宇宙地球環境研究所 奥村曉)', shape='plaintext', fontsize='40', height='2.5')
ノードの縦位置が自動配置されてしまう

「自動配置されてしまう」と Graphviz に文句を言うのは、それが設計思想なので筋違いなのすが、今回の図では愛知県と岐阜県で区分けしたかったため、この自動配置には大変困りました。左→右で進むグラフの場合、追加したノードは下から上に並ぶようです。ただし追加した順通りになるわけではなく、グラフ形状にしたがって自動配置が Graphviz が最適と思うやり方で行われます。

そうすると、愛知県の感染者ノードの中に岐阜が混じってしまったり、その逆も起きます。そこで、手動にて非表示のエッジを多数追加することで、自分の意図した場所に無理やり置くことができるようになります。見えないエッジを追加することで、それらが接続するノードを近接した場所に置こうと Graphviz が機能するためです。しかしこれでも、自分の意図したものに近づくだけであって、Graphviz の挙動を完全に制御することはできません。

graph.edge('aichi134', 'dummy2020-03-19', style='invis')
graph.edge('aichi145', 'dummy2020-03-23', style='invis')
graph.edge('aichi151', 'aichi152', style='invis')
graph.edge('aichi155', 'aichi152', style='invis')
graph.edge('aichi155', 'aichi151', style='invis')
エッジ以外の線が描けない

これも Graphviz の設計思想として、そんなものは必要ないのは明らかですが、エッジ以外の線を自由に描くことができません。今回の場合、愛知と岐阜の県境を滑らかな線で描きたかったのですが、これも非表示のノードを多数配置しそれを点線のエッジで接続することで、無理やり実現しました。県境が滑らかでなくガタガタしているのはこれが原因です。

matplotlib などと連携できない

本当はヒストグラムなどを matplotlib かなんかで描いて、Graphviz の結果も一緒に並べるなんてことをやりたかったのですが、Pythongraphviz モジュールはそれ単体の世界で閉じているので、できませんでした。

エッジが多すぎると作図が発散する

集団感染が発生した場合、多くの感染者ノード同士を何本ものエッジで接続すると、描画結果が大変な場合になることがありました。具体的には岐阜県の飲食店シャルムの集団感染なのですが、ここをエッジで接続するのは諦めました。
f:id:oxon:20200409100712p:plain

ペスト (新潮文庫)

ペスト (新潮文庫)

  • 作者:カミュ
  • 発売日: 1969/10/30
  • メディア: ペーパーバック
銃・病原菌・鉄 上巻

銃・病原菌・鉄 上巻

Gist にきったない Python コードを置いておきます

人に見せるような綺麗なコードではないのですが、Graphviz を使う例として、誰かの役に立つかもしれません。
gist.github.com

Twitter のサムネイル用

f:id:oxon:20200409104542p:plain

オンライン講義の経験談

新型コロナウィルスの影響により、Zoom 等を利用した大学講義のオンライン中継をこの 4 月から始める大学教員の方が多くいらっしゃると思います。僕はこれまでに同様のオンライン中継を 4 年間継続してきました。どのような問題が発生するか、どういう心構えでいれば良いか、個人的な体験を少しまとめておきます。

1. 行なった講義の形態

  • データ解析とプログラミングの講義 ROOT 講習会 2019 · akira-okumura/RHEA Wiki · GitHub
  • 90〜120 分/回のオンライン講義、合計 5〜6 回/年を 4 年間継続(2016〜2019 年のそれぞれ 4〜6 月)
  • 対象者は学部 4 年生と修士 1 年生
  • 板書なしの全てスライド(PDF は事前配布)
  • 名古屋大学の学生 10〜15 名程度は対面で、その様子と Mac のスライド画面を全国 10〜15 大学に中継(リモート接続含め、合計参加者 90 名程度)
  • マイクとカメラは、スライドを上映している Mac を使用

f:id:oxon:20160531090119j:plain
ROOT 講習会の名古屋大学側の様子

2. 感じた問題点

2-1. まるで壁に向かって喋っているようだ

同じ部屋に 10〜15 名程度の学生がいたものの、講師の側からはオンライン接続先の学生の顔が見えません。講師側の映像さえ学生に届いていれば良いようにも思いますが、実際やってみるとそうではありません。

通常の講義では、目の前にいる学生と頻繁に目を合わせることによって、直前に話した内容が理解されているかどうか、講義の進度が早すぎないかどうか、そういうものを講師側が読み取ることができます。例えば首を傾げている学生がいたり、相槌を打っている学生がいたり、板書に対してノートの追いついていない学生がいたり、そういったかなりの情報を講師側は教壇から得ています。

しかし、相手の顔や様子が分からないとなると、ひたすら気にせず一方的に喋り続けるか、もしくは 3 分に 1 回くらい「ここまで大丈夫?よく分からないところある?」といちいち学生に聞き続ける必要があります。この際、これも通常の講義で相手の顔色さえ伺えれば大丈夫かどうか雰囲気で分かるものですが、オンライン接続だと「大丈夫です」と全員が声を上げてくれるわけでもなく、10 秒程度待っても質問がなければ次へ進むという、非常にテンポの悪い進め方になります。

2-2. 質問のタイミング

名古屋大学の物理学科では、対面の講義でもなかなか質問の手が上がらないのですが、これがオンライン接続となるとさらに質問へのハードルが上がるようです。まず、ネットワークには必ず遅延が発生します。そのため、学生が「今だ」と思って質問したとしても、講師側は既に次の話題を話し始めていて、互いにタイミングの狂うことがあります。

また、相手側のマイクが入っていない、音声入力が小さくて聞き取れないといった、海外とのオンライン会議に慣れた研究者でもいまだに発生する問題が、不慣れな学生には頻発します。

加えて、リモートで参加している学生は教室の雰囲気が分かりません。他の学生は分かっているのかどうか、自分が分からないのは音声が途切れ途切れで聞き逃しただけだからではないかなど、通常の講義に比べると質問に対する心理的障壁が高くなると思われます。

2-3. チャット

気軽に質問をしやすくするためチャット画面でも質問を受け付けましたが、まず、こちらの期待するタイピング速度を学生は持っていません。向こうがゆっくりキー入力している間に、講義はどんどん進んでしまいます。

また、チャットでの質問は短文になりがちなため、結局こちらから「こういう意味?」と聞き返す必要がある場合がほとんどで、音声で質問してもらった方がトータルで早いということがありました。

加えて、講師の側は講義を行うのに集中しています。チャット画面をにらめっこしているわけには行かないため、質問されていても気がつかないということもあります。

2-4. 音声、映像が途切れる

これはもう技術的に仕方ない話ですが、音声や映像が途切れたり、途中で会議アプリケーションを立ち上げ直したり、なぜか会議に入り直すことができなくなったりという問題が毎週、毎年発生しました。研究者同士の会議でもこれは発生するので、不慣れな学生相手ではもうどうしようもないと思います。

2-5. ホワイトボードが映らない

スライドだけで講義するにしても、たまにホワイトボードに手書きで説明する必要がどうしても出てきます。この場合、カメラがどこの輝度に合っているかに注意しないといけません。プロジェクターのスクリーンに輝度があっている場合、その横にあるホワイトボードに字を書いても、おそらく配信先の学生には暗すぎて見えないでしょう。講義室にいる人間の眼のダイナミックレンジと、中継カメラのダイナミックレンジは全く異なるということを意識する必要があります。

またスライドではなく黒板でやる場合、カメラの解像度が十分あるか、解像度が十分あったとしても、ネットワークが不安定な相手先でブロックノイズが発生せずに綺麗に見えているかを気にする必要があるでしょう。

また身振り手振りで何かを説明する場合、自分がカメラからはみ出してしまうかもしれません。ホワイトボードもカメラに収まっている視野外にまで文字を書いてしまうかもしれません。

2-6. スライドの行ったり来たり

十分よく練って作ったスライドでも、「さっき説明した通り…」のように、何枚か前のスライドに移動したり、「後で説明するつもりでしたが…」と先に進んだりと、行ったり来たりすることはよくあります。この場合、講義室では即座に移動した先のページが見えるわけですが、接続先の学生の手元ではすぐに画面が切り替わっていないかもしれません。音声だけは途切れずに流れた場合、何ページ目が講義室で示されているのか分からなくなる場合があります。

2-7. 講義室の学生の声が拾えない

参加する学生が全員リモート接続であれば良いですが、通信環境の準備できない一部の学生などは大学の講義室で講義に参加すると思われます。この場合、ノートパソコン内蔵のマイクは講師側に向かっていますので、教室の後ろの席から学生が質問した場合、講師には質問が聞こえるけれどマイクは音を拾わないという状況になります。この場合、講師が「今 XXX という質問が講義室で出ました」と復唱する必要があります。

2-8. 冗談が通じたかどうか、反応が分からない

まあ、これは想像がつくと思います。悲しいです。

3. 改善案

3-1. 質問しやすい環境づくりと質問の練習

初回の講義のときに、マイクが問題なく動いているかの動作確認も含め、質問の練習をさせてみてください。また、じゃんじゃん質問して良いのだ、講義を質問で止めても良いのだ、自分だけ音声が途切れたかもしれないなんて気にしなくて良いのだ、ということを学生に伝えてください。

3-2. スライド PDF は前日までに配布

スライドでやる場合、必ず PDF にして前日までに配布し、講義の開始までに先にダウンロードするように指示してください。50 MB くらいのファイルに最近は簡単になってしまうため、講義の直前に配布したり、講義中に URL を教えたりすると、PDF をダウンロードし終えない学生が出てきます。

3-3. スライドの注意点

必ずページ番号を各ページに入れてください。何ページ目を開いているのか、必ず分かるようにしましょう。また PowerPointKeynote でアニメーションは一切使わないでください。たまに切り替わる静止画を送るのはオンライン会議ソフトは得意ですが、動画を上手に送れるとは期待しないでください。また配布 PDF ではアニメーションは再生できません。間違っても PowerPointKeynote のファイルのまま学生に配布しないように。

3-4. いつもよりゆっくり

通常の講義の 1.5 倍くらい時間をかけて進む必要があると思ってやってください。音が途切れたり、質問のやり取りは、通常の講義よりかなり時間を食います。

3-5. 接続テストを何回も

院生とかに協力してもらって、事前に接続テストをしっかり行なってください。

3-6. 録画する

途中で接続できなくなったり音声や画面が途切れてしまう学生が必ず出ます。これを学生の責任とするのはあまりに酷なので、そのような学生が後で視聴できるよう、講義を録画してください。

3-7. 質問の声の大きさ

講義室で質問する学生には、マイクで音を拾いやすいよう、大きな声で質問するよう、事前に依頼してください。

3-8. 心を強く持つ

相手の顔が見えない状態で講義をするのは、かなり心の折れる作業です。僕はメンタル強い方だと思いますが、ここ数年間で一番辛い仕事でした。

3-9. 板書に相当するもの

手元の PC のスライドを画面共有する場合、iPadApple Pencil などを活用して、板書に替わるものを用意しておくと便利かもしれません。その場合、PC と iPad の両方から同じ会議に参加する形が便利ではないかと思います。

全部黒板を使っての講義の場合、それを全て iPad に置き換えるというのは難しいかもしれません。

3-10. 講義室ローカルの雑談で盛り上がらない

学生側が活発な講義の場合、質問や講師側の雑談から、少し話が脱線して講義室内にいる人だけで雑談が発生する場合があります。これはリモート参加者からすると苦痛でしかありません。マイクで音を十分拾えず、また雰囲気も分からないからです。ついつい講義室にいる学生に向かって話してしまいがちですが、リモート接続の学生が主たる聞き手だという意識を 90 分持続しましょう。

論文の読み方入門

対象読者

この記事はうちの研究室に入ってくる学部 4 年生や修士 1 年生に向けたものです。論文の読み方について説明しますが、どの分野でも当てはまることかは分かりません。また研究室や指導教員ごとに、色々と考え方があると思います。

大学院に進学すると「論文を読め」と言われます。しかし読んだことのないものを読むのは大変なものです。「読め」と言ってくる教員も、自分たちが若かりし頃に論文を読むのに苦労したことを忘れてしまっている場合もあります。論文とはそもそも何なのか、論文をどうやって読んだら良いか、毎年新入生に説明するのもこちらも大変なので、記事にまとめます。

論文とは

大学院生や研究者が研究をすると、その結果を論文と呼ばれる形態にして世界に発信します。どのような立派な研究をしても、論文という形で誰でも読める状態にして発表しない限り、その結果が人の目に触れることはないからです。研究結果を論文にまとめて発表するというのが、その研究の一つのゴールだと言えます。

論文として発表する以外に、国際会議や学会などでの講演、特許の取得という方法もあります。しかし口頭発表などをするだけでは、その場にいた人にしか研究成果を伝えることはできません。そのため、いつでも誰でも世界中から研究結果を見ることができるよう、論文にして後世に記録を残すのです。

何か新しい研究を始める前に、すでに誰かがその研究をやっていないか調べる必要があります。これを先行研究を調べると言います。研究というのは先人が積み上げた科学成果の上に立って、さらに科学を発展させていく作業ですので、誰かが過去にやったことを繰り返しても意味がありません。また、研究をする上で先人の失敗や問題点を知っておくのも、自分の研究を円滑に進める上で重要なことです。

論文は数ページから数十ページの文章です。これを複数まとめて掲載する媒体を論文誌とか学術誌とかジャーナルと呼びます。有名なものだと、Nature とか Science とか Physical Review Letters があります。このような論文誌は週刊誌などと同じように、複数をまとめて号 (volume) という単位で発行します。また、その号の中で通しのページ番号を振られます。ある特定の論文を指すには、著者名、雑誌名、号、ページ番号、発行年を並べます。例えば、次のように書きます。

Akira Okumura, Astroparticle Physics 38, 18–24 (2012)

論文の種類

論文には大きく分けて 3 つの種類があります。

査読論文

論文出版の流れは大雑把に次のようになります。

  1. 研究して結果が出る
  2. 論文にまとめる (論文を書きながら研究することもあります)
  3. 論文の出版社に投稿する
  4. 通常はレフェリー (査読者) から査読コメントというものが返ってくるので、これに従い論文を改定して出版社に送り直す (ここで掲載拒否 = reject される場合もあります)
  5. 論文が受理 (accept) される (受理されない場合もあります)
  6. PDF としてオンラインで公開される
  7. 紙媒体に印刷されて、場合によっては大学の図書館に収まる (オンラインしか存在しない論文誌もあります)

業績として見なされるものは通常これです。うちの業界では、査読のない論文というのは滅多にありません。

上記の Okumura (2012) の例だと、論文本体は http://dx.doi.org/10.1016/j.astropartphys.2012.08.008 から HTML や PDF で入手可能です。

国際会議プロシーディングス

多数の研究者が集まって研究成果を発表する国際会議が世界中でたくさん開かれています。これら会議、特に規模の大きいものでは (うちの分野だと ICRC や SPIE や IEEE や VIC など)、プロシーディングス論文 (proceedings paper) というものを発表者が書く場合があります。これは会議で発表した研究内容を数ページの比較的短い論文として執筆し、会議に参加しなかった人でも読めるようにするものです。

ただし、査読論文 (対義語としてフルペーパーと呼ぶこともある) に比べ、研究の途中結果の場合が含まれる場合が多々あります。また、すでにどこかで査読論文として出し終えたものの焼き直しだったりする場合もあります。逆にプロシーディングスとして発表されたのに、いつまで待っても査読論文として最終結果の出てこない研究もあったりします。

このような論文は、査読のあるものもあれば査読のないものもあります。特に査読のないものは、その品質があまり保証されません。査読があっても、普通の査読論文に比べると査読がしっかりしていない場合も多いので、うちの分野では総じて品質が高くありません。そのため、「論文を読め」と指導教員に言われた場合、査読論文を指していることが多いでしょう。

一方、途中経過であったり質が高くなくとも、プロシーディングス論文から研究の最新情報を得られる場合はたくさんあります。特に何年もかかる装置開発などの場合、途中経過であってもプロシーディングス論文から多くの情報が得られる場合が多いです。必要に応じてきちんと読みましょう。

arXiv

https://arxiv.org/archive/astro-ph
査読論文はレフェリーとのやり取りで半年や 1 年を費やすこともあるため、最新の研究を世界中に伝えるには必ずしも良い方法ではありません。そのため、論文を書いたらすぐに世の中に出したい場合、arXiv というサービスを使うのがうちの業界では一般的です。

arXiv は書いてすぐのものを査読なしで投稿することができるため、査読論文として出版される最終版と中身が異なるものが多くあります。特に理論の論文だとその割合は高くなります。もし論文を読むときに arXiv でその論文を見つけた場合でも、出版社の出している最終論文がないかを確認し、最終版を読むようにしてください。

実験系の論文は最終的な結果や数字以外を出したくないので、特に大きな実験グループの場合、査読論文として受理された後に arXiv に載せる場合が多いです。

先述の論文例だと、https://arxiv.org/abs/1205.3968 がそれです。

論文へのアクセス

多くの出版社は営利企業が運営しており、読者からの購読料を集めない限り運営ができません。そのため論文を読むためにはその対価を支払わなくてはいけません。図書館に置かれている論文誌は、図書館が出版社から購入したものです。

しかし学生や研究者がオンラインで PDF 論文を読みたい場合、論文ごとに何千円も支払うのは非効率です。そのため、多くの大学や研究機関では多数の出版社とオンラインアクセスのための契約をしています。その大学のネットワーク内から論文にアクセスすると接続元の IP アドレスを確認し、それが契約を結んでいる大学のものであれば、論文を無料で (実際は大学が何億円も払って購読料で契約している) 読むことができます。自宅などからアクセスすると、金を払わないと読めないと表示されるでしょう。

しかし近年になって、国民の税金でやった研究成果を見るために営利企業にさらに国民が料金を支払わないといけないのはおかしいとか、商業出版社の寡占化 (大学の支払う購読料が値上がりし続ける) が問題視されています。そのためオープンアクセス (open access) と呼ばれる、誰でもどこでも論文を読めるように PDF が公開されている論文誌も多く出てきました。

慣れないうちの論文の読み方

進学して最初の頃は、背景となる最新研究、これまでの過去の研究の経緯、どのような実験・観測装置があるかといった知識が圧倒的に不足しています。量子力学電磁気学の勉強は何十年も前に構築された基礎物理ですので、これだけを一生懸命勉強してきても残念ながら論文は読めないのです。

また、大学入試程度の英語力 (例えばセンター試験の英語で 95% の得点率) では論文を素早く読むことはできません。業界特有の英語が使われていたり、日本語で物理を勉強したために対応する英単語を知らない、また入試に出てこないような英単語も多く出てきます。これに前述の知識不足が重なるのですから、最初は短い論文であっても読むのに苦労すると思います。

ですので、「読め」と言われて「読めませんでした」となるのはごく自然なことなので、あまり悲観的にならないでください。しかしそれを乗り越えないと論文は読めるようになりませんし、多読と慣れと勉強でどうにかなりますので、諦めずに読んで下さい。

最初は読めないのは当たり前なので、「自分が英語が苦手だからだ」と思うことなく、わからない部分は教員や先輩にどんどん質問をしましょう。とても簡単な英単語でも、その物理背景を知らないとさっぱり意味が分からないことは多々あります。

例えば僕が M1 のときにスーパーカミオカンデの論文を読んだのですが、「electron-like event」のような言葉が全く理解できなかったのを覚えています。単語自体は簡単で直訳すれば「電子風事象」ですが、何が「風 (ふう)」なのか理解不能でした。これは背景となる反応プロセスを理解していないため、英語としては意味が理解できても、物理として意味が分からないのです。

論文を読む上での要所

論文を読んできた学生に僕がいつも尋ねるのは、「で、この論文は何がどう面白いの?」ということです。論文というのは何かしらの科学成果が書かれているわけですから、それが科学的に重要な (= 科学として面白い) ものであれば、何が重要な成果なのかが必ず書かれているはずです。つまり面白い話のオチ (論文の結論) が書かれているはずです。

しかし政治を理解していないと時事ネタの冗談のオチが理解できないように、背景となる知識の不足や英語の読解力不足があると、その論文の面白さを理解できません (論文自体がまったく面白くないという場合もありますが)。ですので、自分がその論文をちゃんと読めているかどうかは、その論文の面白さが理解できたかで判断するのが簡単です。

次に、なぜこの論文が書かれたか、研究が行われたのかを説明できるかを確認しましょう。これは研究の背景が理解できているかの確認になります。

そして、論文に出てくる図の一つ一つから何が言えるのか、なぜその図がその論文には必要なのかを説明してみましょう。論文はある動機や仮説、研究背景から始まり、何かしらの結論に辿り着くように書かれています。論文中の図表は、その結論に進む論理展開を支持するために必要な材料なのです。ですから、なぜその図があるのか、その図から何が言えるのかを理解できているというのは、その論文の論理展開を追うことができたということです。

論文によっては不必要な図があったり、論理展開がそもそもおかしい場合もあるので、論文がおかしいと思ったら、論文に書かれていることを鵜呑みにせず、自分の考えも大切にしましょう。

少し慣れたら

論文を数本読んでみて、書かれていることをなんとなく理解できたら、その論文で引用 (citation) されている論文にも目を通してみましょう。例えば今読んでいる論文がある天体の観測論文だった場合、他の望遠鏡による観測の論文や、同一の望遠鏡でも過去に観測した例などが引用されているはずです。

一つの論文には何十もの引用がされているのが普通なので、全てを通読する必要はありません。ただ、引用されている論文の中身を知らないと、読んでいる論文の動機自体がそもそも理解できない場合が多々あります。そのような場合、引用されている論文の概要 (abstract) や図だけでも目を通してみましょう。

Abstract というのは、その論文に何が書かれているかを短くまとめた、通常 1 段落の文章です。論文の先頭には必ずこれが書かれており、論文全体を読む必要があるか、面白いかどうかはこれを読んで判断することがほとんどです。

その他の情報

ADS

論文情報へのリンクとして論文誌そのものや arXiv へのリンクではなく、ADS での情報がやり取りされることがあれます。ADS とはハーバードや NASA の運営する天文関係の論文データベースです。宇宙線関係の論文もほとんどのものが網羅されています。先述の論文だと https://ui.adsabs.harvard.edu/#abs/2012APh....38...18O/abstract に情報が掲載されています。

DOI

DOI とは、書籍や論文などの出版物に固有の ID を振る仕組みです。出版社が買収や倒産で URL が変更になったりしても大丈夫なようになっています。先述の論文の DOI は  10.1016/j.astropartphys.2012.08.008 であり、この先頭に http://dx.doi.org/ をつけることで論文のページに飛ぶことができます。

剽窃について

この記事は修士論文 LaTeX テンプレートとして公開しているものの第 5 章からの転載です。リンク先は LaTeX のソースファイルですが、コンパイル済みの PDF 文書は「添削者を困らせることのない修士論文の書き方の研究」として入手可能です。

github.com

第 5 章 剽窃について

5.1 剽窃とは何か

剽窃(ひょうせつ)」とは

  • 「他人の作品や論文を盗んで、自分のものとして発表すること。」『大辞泉
  • 「他人の作品・学説などを自分のものとして発表すること。」『スーパー大辞林
  • 「他人の著作から,部分的に文章,語句,筋,思想などを盗み,自作の中に自分のものとして用いること。他人の作品をそっくりそのまま自分のものと偽る盗用とは異なる。」『ブリタニカ国際大百科事典 小項目事典』

のように辞書では説明されています。

例えばここで『ブリタニカ国際大百科事典 小項目事典』を引用元として明記せずに、

剽窃(ひょうせつ)とは、他人の著作から部分的に文章語句思想などを盗み自作の中に自分のものとして用いることです。他人の作品をそっくりそのまま自分のものと偽る盗用とは異なります

という説明をしたとします。これが剽窃です。この例では赤字で示したとおり、文体をですます調に変更したり、読点を「,」から「、」に変更したり、文頭に「剽窃(ひょうせつ)とは、」と書き加えたりしていますが、全体としては同一の文章であるため、通常は剽窃と見なされます。

学術論文ではない創作物の形態によっては、剽窃行為が「インスパイア」や「オマージュ」という言葉で括られることもあります。しかし修士論文での剽窃行為は不正行為です。試験でのカンニングやレポートの丸写しと同じであり、(まともな大学や研究室であれば)厳しく罰せられます。

5.2 剽窃をするとどうなるか

修士論文中に剽窃行為が発見された場合、その学期における単位をすべて没収され、卒業に必要な単位が与えられず修士課程を修了できなくなる可能性が高いです。各大学や研究科でどのような対応を実際に取るかはそれぞれだと思いますが、少なくとも私が審査員を担当した場合には落第させます。

修論審査に落第すれば、もし就職が決まっていても留年を余儀なくされます。留年を選択せず修了を諦めて中退するにしても、就職先は剽窃行為のせいで修了できなかった学生をそのまま採用はしてくれないでしょう。仮に同じ企業に就職が認められたとしても、修士卒扱いで入社できたはずのところが学部卒扱いとなり、初任給が月額数万円低い状態から開始となります。例えば同期と2万円の月給差を保ったまま40 年間働くとすると生涯収入で 1000 万円程度の損失になります。もし留年する道を選んでも、定年時点で1000万円程度の年収を見込めるのであれば、生涯収入としてその額だけ失うことになります。

もし博士課程に進学する場合、なぜ留年したかの説明を陰に陽に常に求められます。たとえ直接にその理由を問われることがなくとも、他の学生より1年多く修士課程に時間がかかったということは、優秀な学生ではないと周りから見なされ、研究をする上でも奨学金などを取得する上でも不利になるでしょう。また標準年限を超えての在籍の場合、大学院の授業料免除などの制度も利用できなくなる可能性があります。

5.3 修士論文における剽窃について

節 5.1 に引用した一般的な剽窃の定義ではなく、科学文書や、特に修士論文での剽窃についてもう少し踏み込んで説明し直してみましょう。

5.3.1 いわゆるコピペ

少なくとも宇宙物理学分野における修士論文は独自性のあるものでなくてはいけません。独自性のある(オリジナル)とは次のようなことです。

  • 誰かが過去にやった研究ではないこと
  • 自分自身の手でやった研究であること(共同研究であれば、十分に自分の貢献のあること)
  • 研究本体以外の章も含め、すべて自分の言葉で説明できること

したがって、誰かの論文や教科書の記述をそっくりそのまま持ってきて(いわゆる「コピペ」して)、それを自分の修士論文として提出することは許されません。高校や大学のレポートなどでも、他人のレポートを写すなと散々注意されるのと同じことです。

これはコピペする文章の長さに依りません。たとえ1行であってもコピペはコピペであり、剽窃と見なされます*1

もちろん、ある文章を他の論文や書籍から引用(quote)する必要のある場合は、逆に改変してはいけません。そっくりそのまま書き写し、それを自分の文章とは別のものであると分かるように引用符や枠で囲むなりします。しかし宇宙物理学関連の修士論文でこのような引用をすることは、ほとんどないと思います。

5.3.2 他人の文章の改変

コピペとともによく見られるのが、他人の文章を一部だけ改変して自分が書いたかのように装うことです。完全に同一のものを持ってくる方が簡単ですし、なぜこのような行動を取るのかよく分かりませんが、私の経験として最も多い剽窃行為がこの文章の一部改変です。

もしかすると「先輩の修論を写したりコピペするなよ。自分の言葉で書けよ」とだけ教員から指導を受けると、表面的に一部改変すれば剽窃にはならないと勘違いするのかもしれません。しかし元の文章が存在しなければ作成できないのですから、これは独自性のある文章とは見なされず、やはり剽窃行為となります。

たとえば次のような文章が「元ネタ」として存在していたとしましょう*2

1910 年代に Hess らによって宇宙線の存在が確認されて以来、様々なエネルギー領域、様々な検出器によって宇宙線の観測が行われてきた。同時に、ガリレオ以来発達してきた可視光による天体の観測も、電波望遠鏡や赤外望遠鏡の登場によって多波長での観測へと発展することとなった。

宇宙線と言っても、その成分は電磁波、陽子、原子核、neutrino など様々であり、それらの持つエネルギーも広範にわたる。現在地球上で確認されている宇宙線のうち、最もエネルギーの高いものは 10^{20} eV を超える(最高エネルギー宇宙線)。これは人工的に到達できるエネルギーを実に 8 桁も上回るが、なぜそのような高エネルギーの宇宙線が存在するのかは謎である。加速機構、地球までの伝播過程、1 次宇宙線成分は何であるのか、いずれも未解明のままであり、その興味は尽きない。

奥村 (2005) より引用

少しこれを改変してみましょう。赤字が削除箇所、青字が追加箇所です。実際に私が発見してきた剽窃行為には、このような改変が多くありました。

1910年1912に Hessによって宇宙線の存在確認初めて発見されて以来、様々な広いエネルギー領域範囲様々多種多様な検出器によって宇宙線観測が行われてきた。同時にまたガリレオ以来発達してきた可視光による天体の観測での天体観測も、電波望遠鏡や赤外望遠鏡という新しい観測手段の登場によって多波長での観測により、多波長観測へと発展することとなったした

宇宙線っても、その成分は電磁波、陽子、原子核neutrino電子、ニュートリノなど様々であり、それらの持つそのエネルギー範囲広範何桁わたる。現在上で確認されている宇宙線のうち、最もエネルギーの高いものは10^{20} eVを超える(いわゆる最高エネルギー宇宙線)。これは人工的に加速器で人類が到達できるエネルギーを実に 8 桁も上回るが、なぜそのような高エネルギーの宇宙線が存在するのかは謎である解明されていない宇宙線加速機構、地球までの伝播過程、また 1 次宇宙線成分は何であるのか、いずれも未解まま問題であり、その興味は尽きない将来の宇宙線観測計画による解決が期待される

奥村 (2005) を意図的に改変

5.3.3 元の文章を下敷きに自分で考えたつもりになったもの

さらに改変の量を増やし、ところどころに自分の独自の文を入れたり、文の前後を入れ替える剽窃もあります。自分で考えて文を挿入するのだから剽窃ではないと考える人もいるかもしれませんが、やはり元の文章が存在しなければ書くことのできない文章ですので、これも立派な剽窃です。たとえば次のようなものです。

Hess の気球実験によって 1912 年に宇宙線が大気中で発見されてから、様々な粒子、多様な検出手法、また MeV 領域から10^{20} eVにまでおよぶエネルギー範囲で宇宙線の観測が行われてきた。一方、電磁波による天体の観測も、ガリレオによる可視光観測に始まり、電波望遠鏡や赤外線望遠鏡などの登場によって他波長観測へと発展した。さらに近年の重力波ニュートリノ観測を加え、現在の宇宙観測は、多粒子、他波長観測の時代、すなわちマルチメッセンジャー天文学へと進展した。

このうち宇宙線は、陽子、原子核、電子、ニュートリノなどを含む、宇宙空間を飛び交う高エネルギーの粒子である。先に述べたように、その最高エネルギーは10^{20} eVにまでわたる(いわゆる最高エネルギー宇宙線)。これは人類が LHC 加速器で到達できる数 TeV というエネルギーを 8 桁も上回るものであるが、なぜそのような高いエネルギーの宇宙線が宇宙で加速されているのか、宇宙線の発見から 100 年以上が経っても未解決の問題である。その加速機構、加速天体、地球までの伝播、また粒子の種類がなんであるかという謎を解き明かすには、今後の宇宙線観測手法に大きな飛躍が必要である。

奥村 (2005) を意図的に改変

ここまで改変すると、全く違う文章のように感じる人もいるかもしれませんが、実際に行われる剽窃行為では、このような元ネタに改変を加えた文章が何段落も続くことが多いです。そのため、文章の一部が似通っているだけでなく、その章の論理展開自体がほとんど同じになってしまうのです。

研究背景は過去に行われた研究の積み重ねなので、論理展開が同じになることは仕方がないという主張をする学生もいます。しかし修士論文はその研究目的が各々違うわけですから、論文のイントロなどで全く同じ論理展開になることは本来ありえません。その論文独自の研究内容を説明するためにイントロは書かれるべきであり、他の文章と同じであるというのは、イントロを書くという目的を勘違いしています。

5.3.4 出典のない図表の使用

他人の文章を剽窃する行為とは別に、図表を適切に引用(cite)せずに流用するという剽窃もあります。これは悪意があって行われているわけではなく、引用の作法を知らないだけの場合が多いため罪としては軽いかもしれません。しかし、その修士論文の読者に対して「この図は自分が作りました」と嘘をつくのと同じ行為ですので、やはり問題行為であることは理解できると思います。

このような図表の剽窃は、特に共同研究で多く見られます。ある実験プロジェクトに参加している場合、実験装置の説明の図や写真をプロジェクト内で使いまわすことがあるでしょう。たとえば図 4.1 のようなものが該当します。もしこれを出典もしくは作者を明記せずに使用した場合、剽窃行為に当たります*3

図表の提供者の名前を入れる、その図が最初に使われた論文や出版物が存在する場合はそれを出典として明記する(cite する)、もしくは提供した実験グループなどの名前を入れるなどしてください。

5.3.5 アイデアの盗用

他人の考えた研究アイデアを自分が考えたかのように記述するのも剽窃です。例えば投稿論文になっていないものの、先輩の修士論文で先行研究が行われていたとしましょう。これを先行研究として取り上げることなく、「〜〜という手法を本論文では考案し」などと書くのは剽窃行為です。きちんと「〜〜という手法が先行研究で提案され、本論文ではこれを発展させ」のように書きましょう。

5.3.6 自己剽窃

自己剽窃とは、自分の書いた論文などから図や文章を剽窃して再利用することです。なぜこれが問題とされるのか、直感的にはすぐに分からないかもしれません。

自己剽窃が最も問題とされるは、論文の二重投稿です。どこかで論文を出版する場合、レビュー論文でない限り、それぞれが独自の新規性を持つ論文でなくてはいけません。したがって、業績稼ぎのために同じ内容の論文を複数の場所で発表するのは研究不正として扱われます。

次に自己剽窃が問題となるのは、著作権の問題です。投稿論文を科学誌に掲載する多くの場合、その著作権を出版社に譲渡することになります。最近のオープンアクセス(open access)誌の場合には著作権が論文著者に残される場合もありますが、投稿論文の著作権を必ずしも自分が持っているわけではないのだということを覚えておいてください。

著作権が出版社にあるということは、その著作物を引用の範囲を超えて勝手に再利用してはいけないということになります。著作権、英語で書くと copyright ですが、すなわち複製する権利を出版社に譲渡してしまっているからです。

ただし、多くの出版社では学位論文や国際会議のプロシーディングスなどで、著者が図表などを出版社に断らずに使いまわすことを許可しています。ただし、出典を明記することは求められていることが多いはずです。もし投稿論文に使用した図表もしくは文章を修士論文で使いまわす場合、出版社との著作権の契約について理解しておきましょう。たとえば Elsevier 社の場合、http://jp.elsevier.com/authors/author-rights-and-responsibilities に著者の権利が書かれています。他の出版社も同様の情報を公開しています。

5.4 なぜ剽窃は許されないのか

なぜ剽窃行為は許されず、それが修士論文で不正行為とされるのか、その理由を改めてまとめます。

  • 学位審査は、学生が研究背景などを理解しているか、またそれを自分の言葉で伝える能力を身につけているかを審査する場です。したがって、剽窃を含む文書ではこの審査を適切に行えなくなってしまいます。修士の学位を与える審査の一環として修士論文を執筆しているわけですから、修士論文作成能力がないのにそれを他人の文章を使って誤魔化すのは、当然不正行為になります。
  • 同じ文章を使いまわすとき、一般的には引用 (cite ではなくて quote) をし、自分の書いた文章と他人の文章を区別するのが標準的です。超新星の過去の記録など一部の例を除き、宇宙物理学分野でquoteのほうの引用をすることはほとんどありません。もし必要となる場合は、他人の書いた文章であることが明確に読者に分かるようにしましょう。自分で作った文章かのように見せるのは決して許される行為ではありません。
  • 他人の書いた文章を自分が書いたかのように見せるのは、人の手柄を横取りすることになります。
  • 少なくとも日本の国内においては、他人の著作物を勝手に使用したり改変したりすることは、著作権の侵害に当たる行為です。
  • 元の文章を無理に改変することにより、推敲された元の文章よりも質の低い文章になることが多く、また間違った記載となる場合が多々あります。例えば「突発天体を観測する」を無理やり「突発天体を監視する」に変更することにより、意味が大きく変わることもあります。
  • 同じものを繰り返すというのは、先人の研究をさらに発展させていくという、科学の営み自体を否定する行為です。
  • 過去数年で該当分野に大きな進展があった場合にも、それを無視した様な文章が生産されてしまいます。例えば 2018 年の修論なのに重力波が未だ検出されていない前提の文章になっていたりということが考えられます。
  • 修論の添削をする教員は、執筆した学生の研究能力や文章作成能力を高めるために添削をしています。良い出来の修論を書かせることが目的ではないのです。そのため、本人が書いてすらいない文章を添削させ、大学教員の貴重な時間を奪うことは、学生と教員の間の信頼関係を大きく毀損する大変失礼な行為です。またそのような添削をしても本人が書いていないのですから、その学生の能力向上には全く役に立たず、学生も自分で考えることなく言われるがままに改訂を繰り返すことになるでしょう。

*1:ただし、ごくありふれた表現や、酷似するのが避けられない科学的事実は除く。

*2:これはきちんと添削を受けていない、今となっては恥ずかしい私の修論の一節ですが、あくまで例です。

*3:おそらく「出典を明記して再提出しろ」と言われるだけで、落第はしないと思いますが。

国際会議論文で使用した図の投稿論文での再利用

国際会議の proceedings paper の執筆と、学術誌への査読論文 (full paper) の投稿がほぼ同じ時期に発生したり、投稿論文の作成が後になるということは多々あると思います。このような場合、両者で同一の図を使いまわすと問題の発生する場合があります。

  1. 同じ内容を新規性のある研究成果として複数箇所で発表することは二重投稿や自己剽窃とみなされる場合があり、研究倫理上好ましくない。
  2. 論文として図が掲載される場合、その図の著作権の帰属先が著者ではなく出版社の場合があるため、異なる出版社に同一の図の権利を渡すことはできない。
  3. 論文で使用する図は、世の中に先に出たものが原則として原典になるため、後から出版された同一の図は、原典を引用するべきである。

投稿論文が先に出て、その図を国際会議の proceedings paper で再利用することは、出典を明記さえすれば著者の権利として認められている場合が多いようです。もし図の著作権を出版社に譲渡していても、proceedings paper などで再利用できるという説明が多くの出版社から出ています。

しかしその逆で、proceedings paper が先に出てしまっており、投稿論文でその中の図を再利用したい場合にどうすれば良いかは、出版社の website を見ても明記されていないようです。上記の問題を回避するためだけに、似ているけど同一ではない図を作り直すのも馬鹿らしい作業なので*1、投稿論文を受け取る出版社側としてはどのような著者の行動を望むのかを編集部に問い合わせ、これまでいくつか実践してみましたので、まとめます。それぞれ追加した文は、編集部の指示に従ったものです。

これまでの経験では、proceedings paper から full paper への図の転載はどれも認めてもらえました。もちろん出版社や、同じ出版社でも編集部によって対応が異なる可能性があるので、心配な場合はその都度問い合わせると良いでしょう。

SPIE から IOP Publishing (OA) の場合

  • 転載元:SPIE の proceedings paper (著作権が SPIE に帰属)
  • 転載先:IOP Publishing の OA (著作権が著者、CC BY 3.0 で配布)
  • 図の中身:使い回ししやすい、実験装置の写真

" [11] (© (2014) COPYRIGHT Society of Photo-Optical Instrumentation Engineers (SPIE), see reference for details)"

という文を追加。

Website の図から IOP Publishing (OA) の場合

  • 転載元:自分の所属する実験グループの website (CC BY 4.0)
  • 転載先:IOP Publishing の OA では著作権が著者にあるが CC BY 3.0 で配布
  • 図の中身:使い回ししやすい、実験装置の CG

"(reproduced from [1] under CC BY 4.0, credit: G. Pérez, IAC, SMM)"

という文を追加。

PoS から IOP Publishing (OA) の場合

  • 転載元:Proceedings of Science の OA (著作権は著者、CC BY-NC-SA 4.0 で配布)
  • 転載先:IOP Publishing の OA (著作権が著者、CC BY 3.0 で配布)
  • 図の中身:使い回ししやすい、実験装置の CG

"The figures are taken from [16] (reproduced under CC BY-NC-SA 4.0, see reference for details)."

という文を追加。

PoS から Elsevier の場合

  • 転載元:Proceedings of Science の OA (著作権は著者、CC BY-NC-SA 4.0 で配布)
  • 転載先:Elsevier (著作権が Elsevier に帰属)
  • 図の中身:シミュレーション結果

"((d)–(i): Taken from [29])." や "This figure was taken from [29]. "

という文を追加。ただし、改めて考えてみると、"CC BY-NC-SA 4.0" であることを明記するべきだったのではないかと思う。

PoS から IOP Publishing/AAS

  • 転載元:Proceedings of Science の OA (著作権は著者、CC BY-NC-SA 4.0 で配布)
  • 転載先:IOP/AAS (著作権が AAS に帰属)
  • 図の中身:シミュレーション結果

元の図が CC なので、それを明記すれば転載して良い (ただし最終的に転載しなかった)。

*1:現実には、そんな問題は考えもしないで、平気で複数箇所で同じ図を使い回す研究者がうちの分野では多数派です。