четверг, 2 октября 2014 г.

Про проверку данных

Пара примеров научных статей, когда проверка данных оказывалась нелишней.

Плавление в условиях нижней мантии, над которым я работаю, практически не изученная область. Публикации де-факто начались лет 10-15 назад, и до сих пор это скорее единичные эксперименты, а не систематические исследования. Соответственно, качество публикуемых материалов оставляет желать много лучшего - каждая новая статья просто публикует данные, которые почти не с чем сравнивать (и тут просто нельзя взять другую статью заместо непонравившейся, ведь каждая статья содержит единственные в мире данные о веществах!). И нет сообщества людей, которые бы эти данные использовали. Я, как бы громко это ни звучало, один из первых людей, кто эти данные пытается применить (а не просто скопировать себе график).
Случай первый, который был пару месяцев назад. Тогда я только начинал разбираться со всеми тонкостями расчётов в рамках подхода Mie-Gruneisen с уравнениями состояния Birch-Murnaghan, о чём я писал раньше.

Благодаря моей фантастической удаче, та статья, для которой я решил попробовать воспроизвести графики (чтобы проверить, что мои уравнения вообще правильны - ведь они нигде не собраны в пособие "делай раз - делай два"), была с неправильным графиком. И, чтобы полностью уверить меня в собственном кретинизме и физматической недееспособности, следующая статья того же автора (ну не могла же она ошибиться дважды!), была тоже с ошибкой.
Собственно, сами статьи, [Thomas et al., 2012], [Thomas, Asimow, 2013], опубликованы в одном из самых топовых журналов "отрасли" - Journal of Geophysical Research: Solid Earth с далеко не низким impact-factor 3.44.

Примерно через неделю чтения литературы с 70-х годов я понял, что проблемы не у меня. Написал автору, выяснилось, что это действительно ошибка в графике.

Собственно, сам график (он из расчётного файла, потому с неаккуратностями). Красная линия - правильный расчёт, голубая - опубликованная кривая. Разница более 10%.


Случай второй, с которым я столкнулся только что. Раньше мой программный код использовал примитивную параметризацию объёма расплавов и твёрдых фаз, которую я написал обслюнявленным пальцем на окне трамвая от скуки родил в муках и чтении трактатов отцов-основателей термодинамики:
\[V = (a_1T+a_2)P^2 + (a_3T+a_4)P + (a_5T+a_6) \]
У неё было одно неоспоримое достоинство - она работала.

Так как я свято придерживаюсь принципа "с каждым днём всё дальше", то я в какой-то момент решил попробовать вместо моей ереси вставить нормальные истинно-верные уравнения - собственно, Mie-Gruneisen + Birch-Murnaghan. Ну и вместо моих коэффицинтов $a_i$ я взял термодинамически-осмысленные параметры из таблички в исходной статье [de Koker et al., 2013]. И внезапно я получил такую картинку:


На этой картинке показана разница плотности расплава и сосуществующей твёрдой фазы, выраженная в процентах. По горизонтали - давление в ГПа, по вертикали - количество расплава в % (что определяет температуру). Как видно, разница плотности везде отрицательна (-6 - -18 %), то есть расплав везде легче, чем твёрдая фаза!

Проблема же только в одном - последние годы считается, что ультраглубинные силикатные расплавы тяжелее твёрдого вещества, и статья как раз утверждает (в картинках, смею отметить), что им это удалось получить.
Собственно, я проверил всю свою математику, воспроизвёл несколько других статей, после чего понял, что проблема не во мне.

И я вставил свою простую параметризацию для объёмов расплава назад:

И внезапно (снова) появилось поле расплавов, которые плотнее кристаллов!

В чём причина? Причину назвать сложно. Самыми вероятными причинами являются недостаточное количество знаков в табличке или же просто неверными значениями. Второе может быть как из-за банальных ошибок подбора параметров (тем более, что их около 10 штук), так и из-за того, что в статью пошла какой-то устаревший набор параметров (из неправильного расчёта).
Я склоняюсь ко второму. Во-первых, если смотреть supplementary materials к этой статье, что собственные значения в графиках у авторов не соответствуют расчётным (моя же параметризация все их данные воспроизводит). Во-вторых, все графики у авторов в статье согласованы.

Чем можно резюмировать? Что веры нет никому, а все данные из статей, по которым вы собираетесь что-то рассчитывать, надо уметь воспроизводить самому. Иначе слишком большой шанс совершить много увлекательных открытий - только опровергать уже тогда будут ваши выводы, а неправильные уравнения останутся за кадром.

PS: на редакторов уповать бесполезно - ведь в их обязанности не входит пересчёт каждой таблички и графика.

Комментариев нет:

Отправить комментарий