Статистический анализ

При анализе случайно шероховатых поверхностей нередко требуется статистический подход для определения некоторого набора типичных величин. В Gwyddion есть несколько различных путей как это можно сделать. В этом разделе мы опишем различные статистические инструменты и модули, представленные в Gwyddion, а также представим основные формулы, которые использовались для разработки лежащих в их основе алгоритмов.

Данные сканирующей зондовой микроскопии обычно представляются как двумерное поле данных размера N×M где N и M – число строк и столбцов поля данных, соответственно. Настоящая площадь этого поля обозначается как Lx×Ly, где Lx и Ly – размеры вдоль соответствующих осей. Интервал дискретизации (расстояние между двумя соседними точками в скане) обозначается Δ. Мы предполагаем, что интервал дискретизации одинаков как в x, так и в y-направлении и что высота поверхности в заданной точке (xy) может быть описана случайной функцией ξ(xy) с заданными статистическими свойствами.

Следует заметить, что данные АСМ обычно собираются как линейные сканы вдоль оси x, которые объединяются вместе, чтобы сформировать двумерное изображение. Следовательно, скорость сканирования в направлении x значительно больше, чем скорость сканирования вдоль оси y. В результате, статистические свойства данных АСМ обычно собираются вдоль профилей, параллельных оси x, поскольку на них меньше влияет низкочастотный шум и термический дрейф образца.

Инструмент измерения статистических величин

Статистические величины включают в себя основные свойства распределения значений высоты, включая его дисперсию, коэффициент асимметрии и эксцесс. Следующие величины доступны в меню инструмента Статистические величины программы Gwyddion:

  • Среднее значение, минимум, максимум, срединное значение.
  • Среднеквадратичное значение неровностей высоты: это значение вычисляется из дисперсии данных.
  • Ra значение неровностей высоты: эта величина аналогична среднеквадратичному значению с единственной разницей в экспоненте (степени) в сумме отклонений данных. Поскольку для среднеквадратичного эта экспонента равна q = 2, значение Ra рассчитывается с экспонентой q = 1 и модулем значений данных (нулевым средним).
  • Коэффициент асимметрии распределения высот: вычисляется из третьего центрального момента значений данных.
  • Эксцесс распределения высот: вычисляется из четвёртого центрального момента значений данных.
  • Площадь проекции и площадь поверхности: подсчитывается простой триангуляцией.
  • Средний уклон граней в области: вычисляется усреднением нормализованных векторов направления граней.

Подсказка

По умолчанию инструмент «Статистические величины» показывает значения для всего изображения. Если вам нужно исследовать определённую область внутри изображения, просто щёлкните мышью и обведите её прямоугольником. Окно инструмента обновится с новыми значениями основанными на новой области. Если вы снова хотите просмотреть статистику для всего изображения, щёлкните один раз на окне данных и инструмент сбросится в исходное состояние.

Точнее, среднеквадратичное отклонение (σ), коэффициент асимметрии (γ1), и эксцесс (γ2) вычисляются из центральных моментов i-того порядка μi в соответствии со следующими формулами:

Площадь поверхности оценивается следующим методом. Пусть zi для i = 1, 2, 3, 4 обозначает значения в четырёх соседних точках (центрах пикселей), а hx и hy - размеры пикселей вдоль соответствующих осей. Если дополнительная точка помещается в центр прямоугольника который соответствует общему углу четырёх пикселей (используя среднее значение четырёх пикселей), образуются четыре треугольника и площадь поверхности может быть приближенно оценена суммированием их площадей. Это приводит к следующим формулам для площади одного треугольника (верхняя) и площади поверхности для одного пикселя (нижняя):

Метод теперь хорошо определён для внутренних точек области. Каждое значение участвует в восьми треугольниках, по два с каждым из четырёх соседних значений. Половина из этих треугольников лежит внутри одного пикселя, другая половина в другом пикселе. Подсчётом площади, лежащей внутри каждого пикселя, общая площадь определяется также для зерён и областей под маской. Осталось определить её для граничных пикселей всего поля данных. Мы это делаем виртуально расширяя поле данных копией граничного ряда пикселей с каждой стороны для нужд расчёта площади поверхности, следовательно делая все интересующие нас пиксели внутренними.

Схема триангуляции при рассчёте площади поверхности (слева). Применение схемы триангуляции (справа) к области под маской из трёх пикселей, т.е. зерну. Малые круги обозначают вершины в центрах пикселей zi, тонкие пунктирные линии обозначают границы пикселей, толстыми показано разбиение на треугольники. Оценка площади поверхности равна области под маской (серой) на этой схеме.

Инструмент статистических функций

Одномерные статистические функции доступны при использовании инструмента Статистические функции. В окне инструмента можно выбрать, какую функцию нужно рассчитать используя выпадающий список слева, озаглавленный Тип вывода. Предпросмотр графика будет обновляться автоматически. Можно выбрать направление, в котором будут рассчитываться функции (горизонтальное или вертикальное), но, как уже говорилось выше, мы рекомендуем использовать направление быстрой оси сканирования. Также можно выбрать, какой из методов интерполяции использовать. После того, как выбор закончен, можно нажать кнопку Применить чтобы закрыть окно инструмента и вывести новое окно графика, которое содержит данные статистики.

Подсказка

Подобно инструменту Статистические величины, этот инструмент оценивает по умолчанию всё изображение, но при желании можно выбрать область, на которой будет проводиться анализ.

Функции распределения высоты и углов

Простейшими статистическими функциями являются функции распределения высот и наклонов. Они могут быть рассчитаны как неинтегральные (т.е. плотности) и как интегральные. Эти функции рассчитываются как нормированные гистограммы значений высоты или наклона (полученного как производные в выбранном направлении – горизонтальном или вертикальном). Другими словами, величина по абсциссе в «распределении углов» – тангенс угла, а не сам угол.

Нормировка плотностей ρ(p) (где p – соответствующая величина, высота или наклон) такова, что

Очевидно, что масштаб значений при этом не зависит от числа точек данных и числа выборок в гистограмме. Интегральные распределения - интегралы плотностей и они принимают значения из интервала [0, 1].

Величины первого порядка против величин второго порядка

Величины распределений высот и углов относятся к статистическим величинам первого порядка, описывающих только статистические свойства отдельных точек. Однако, для полного описания свойств поверхности необходимо изучать функции более высоких порядков. Обычно применяются статистические величины второго порядка, описывающие взаимные соотношения пар точек на поверхности. К этим функциям относятся функция автокорреляции, функция корреляции высота-высота и функция спектральной плотности мощности. Далее следует описание каждой из них:

Функция автокорреляции

Функция автокорреляции задаётся как

где z1 и z2 - значения высоты в точках (x1, y1), (x2, y2); при этом τx =  x1 −  x2 и τy =  y1 −  y2. Функция w(z1, z2, τx, τy) обозначает двумерную плотность вероятности случайной функции ξ(xy), соответствующей точкам (x1, y1), (x2, y2) и расстоянию между этими точками τ.

Из дискретных данных АСМ можно извлечь эту функцию в виде

где m = τxx, n = τyy. Следовательно, эта функия может быть рассчитана для дискретного набора значений τx и τy, разделённых интервалами дискретизации Δx и Δy, соответственно. Двумерная функция автокореляции может быть посчитана с помощью меню Обработка данныхСтатистикаДвумерная автокорреляция.

Для измерений АСМ мы обычно рассчитываем одномерную функцию автокорреляции основанную на профилях вдоль оси быстрого сканирования. Она может, следовательно, рассчитываться из дискретных данных АСМ как

Одномерная функция автокорреляции нередко считается имеющей форму гауссовой, т.е. заданной следующим соотношением:

где σ обозначает среднеквадратичное отклонение высот и T обозначает длину автокорреляции.

Для экспоненциальной функции автокорреляции у нас получается следующее соотношение

Функция автокорреляции, полученная для модели гауссово случайной шероховатой поверхности (т.е. с гауссовой функцией автокорреляции) с σ ≈ 20 nm и T ≈ 300 nm.

Мы можем также ввести радиально усреднённую функцию автокорреляции Gr(τ), которая, естественно, содержит ту же самую информацию, что и одномерная функция автокорреляции для изотропных шероховатых поверхностей:

Примечание

Для оптических измерений (т.е. спектроскопической рефлектометрии, эллипсометрии) гауссова функция автокорреляции обычно ожидается достаточно хорошо совпадающей со свойствами поверхности. Однако, некоторые статьи связанные с ростом поверхности и оксидированием обычно предполагают, что экспоненциальная форма ближе к реальности.

Функция корреляции высота-высота

Различие между функцией корреляции высота-высота и функцией автокорреляции очень мало. Как и в случае с функцией автокорреляции, мы суммируем произведение двух различных значений. Для функции автокорреляции эти значения представляют различные расстояния между точками. Для функции корреляции высота-высота мы вместо этого используем степень разности между точками.

Для измерений АСМ мы обычно рассчитываем одномерную функцию корреляции высота-высота, основанную только на профилях вдоль быстрой оси сканирования. Следовательно, она может быть рассчитана из дискретных значений данных АСМ как

где m = τxx. Таким образом, функция может быть рассчитана на дискретном наборе значений τx разделённом интервалом дискретизации Δx.

Одномерная функция корреляции высота-высота нередко считается имеющей форму гауссовой, т.е. заданной следующим соотношением:

где σ обозначает среднеквадратичное отклонение высот и T обозначает длину автокорреляции.

Для экспоненциальной функции корреляции высота-высота у нас получается следующее соотношение

На следующем рисунке функция корреляции высота-высота построена для модели гауссовой поверхности. Она аппроксимирована формулой, приведённой выше. Результирующие значения σ и T полученные аппроксимацией функцией корреляции высота-высота практически те же, что и для функции автокорреляции.

Функция корреляции высота-высота полученная для модели гауссовой случайно шероховатой поверхности с σ ≈ 20 nm и T ≈ 300 nm.

Функция спектральной плотности мощности

Двумерная функция спектральной плотности мощности может быть записана в терминах преобразования Фурье от функции автокорреляции

Подобно функции автокорреляции, мы также обычно рассчитываем одномерную функцию спектральной плотности мощности, которая задана уравнением

Эта функция может быть посчитана с помощью быстрого преобразования Фурье следующим образом:

где Pj(Kx) - коэффициент Фурье для j-той строки, т.е.

Если мы выберем гауссову функцию автокорреляции, соответствующее гауссово соотношение для функции спектральной плотности мощности будет следующим:

Для поверхности с экспоненциальной функцией автокорреляции мы имеем

На следующем рисунке построены результирующая функция спектральной плотности мощности и её аппроксимация для той же самой поверхности, что использовалась для функции автокорреляции и функции корреляции высота-высота. Можно видеть, что функция может быть снова аппроксимирована гауссовой функцией спектральной плотности мощности. Результирующие значения σ и T практически те же самые, что и для аппроксимации функции автокорреляции и функции корреляции высота-высота.

Функция спектральной плотности мощности полученная для данных, смоделированных с гауссовой функцией автокорреляции.

Мы можем также ввести радиальную функцию спектральной плотности мощности Wr(K), которая, естественно, содержит ту же самую информацию, что и одномерная функция спектральной плотности мощности для изотропных шероховатых поверхностей:

Для поверхности с гауссовой функцией автокорреляции эта функция может быть выражена как

для поверхностей с экспоненциальной как

Подсказка

В Gwyddion можно аппроксимировать все представленные здесь статистические функции их гауссовыми и экспоненциальными формами. Чтобы это сделать, сначала нажмите Применить в окне инструмента Статистические функции. При этом будет создано новое окно графика. При выбранном этом окне, нажмите на ГрафикАппроксимировать график.

Функционалы Минковского

Функционалы Минковского используются для описания глобальных геометрических характеристик структур. Двумерный дискретный вариант объема V, поверхности S и связности (характеристики Эйлера - Пуанкаре) χ рассчитываются в соответствии со следующими формулами:

Здесь N обозначает общее число пикселей, Nwhite обозначает число «белых» пикселей, пикселей выше порога. Пиксели, которые ниже порога, называются «чёрными». Символ Nbound обозначает число границ между чёрными и белыми пикселями. И, наконец, Cwhite и Cblack обозначают число непрерывных наборов белых и чёрных пикселей, соответственно.

Для изображений с непрерывным набором значений функционалы параметризованы по значению порога высоты ϑ, который отделяет белые пиксели от чёрных, т.е. они могут рассматриваться как функции этого параметра. И эти функции V(ϑ), S(ϑ) и χ(ϑ) строятся.

Инструмент статистики по строкам/столбцам

Инструмент рассчитывает численные характеристики каждой строки или столбца и строит их как функции его/её положения. Это делает его в некоторой степени дополнительным к инструменту статистические функции. Доступные величины включают в себя:

  • Среднее значение, минимум, максимум, срединное значение.
  • Среднеквадратичное значение неровностей высоты: это значение вычисляется из дисперсии данных Rq..
  • Коэффициент асимметрии и эксцесс распределения высот.
  • Длина линии поверхности. Эта величина оценивается как общая длина прямых сегментов, соединяющих значения данных в строке (столбце).
  • Общий уклон, т.е. тангенс средней линии, аппроксимирующей строку (столбец).
  • Тангенс β0. Это характеристика крутизны локальных уклонов, близко связанная с поведением функций автокорреляции и корреляции высота-высота в нуле. Для дискретных значений она вычисляется следующим образом:
  • Стандартные параметры шероховатости Ra, Rz, Rt.

В дополнение к графику, показывающему значения для индивидуальных строк/столбцов, среднее значение и среднеквадратическое отклонение выбранной величины рассчитывается из набора отдельных значений для строк/столбцов.

Двумерная статистика наклонов

Несколько функций в меню Обработка данныхСтатистика оперируют статистикой двухмерных наклонов (производных).

Распределение наклонов рассчитывает простое двухмерное распределение производных, то есть горизонтальные и вертикальные координаты поля данных это горизонтальные и вертикальные производные, соответственно. Наклоны могут быть посчитаны как центральные производные (одна сторона на границах изображения) или, если включена опция Использовать аппроксимацию локальной плоскостью, аппроксимацией локальной плоскостью окрестности каждой точки и используя её градиент. Распределение наклонов имеет также другой режим работы называемый График по углам, в котором он строит распределение r2 от φ где мы вводим полярные координаты (rφ) на плоскости производных. Соотношение между декартовыми координатами производных двумерного распределения наклонов и углами наклона граней задаются следующей формулой:

Функция Распределение углов - инструмент визуализации, который не рассчитывает распределение в строгом смысле. Для каждой производной v строится круг точек. удовлетворяющих уравнению

Число точек на круге задаётся параметром Число шагов.

Анализ граней

Обработка данныхСтатистикаАнализ граней

Анализ граней позволяет в интерактивном режиме изучать ориентацию граней, которые встречаются в данных и выделять грани определённой ориентации на изображении. Левое окно просмотра показывает данные с предпросмотром помеченных граней. Правое меньшее окно, ниже именуемое просмотром граней, показывает двумерное распределение наклонов.

Центр грани всегда будет соответствовать нулевому наклону (горизонтальные грани), наклон в направлении x увеличивается в направлении левой и правой границы и наклон в направлении y увеличивается в направлении верхней и нижней границе. Точное представление координатной системы достаточно сложно и оно адаптируется к диапазону наклонов в конкретных отображаемых данных.

Площадь поверхности грани управляет размером (радиусом) плоскости, локально аппроксимированной в каждой токе для определения локального уклона. Специальное значение 0 соответствует случаю, когда аппроксимация плоскостью не проводится, локальный уклон определяется исходя из симметричных x и y производных в каждой точке. Выбор размера окружения критически важен для получения значимого результата: он должен быть меньше, чем те особенности, которые интересуют чтобы избежать сглаживания, в то же время он должен быть достаточно большим чтобы подавить шум, который присутствует в изображении.

Иллюстрация размера аппроксимирующей плоскости на распределение в скане расслоённого алмазоподобного покрытия со значительным тонким шумом. Можно заметить, что распределение полностью скрыто шумом при малых размерах плоскости. Размеры окружения: (a) 0, (b) 2, (c) 4, (d) 7. Шкалы углов и псевдоцвета растянуты на весь диапазон для каждого изображения, т.е. они различны для разных изображений.

Как окно просмотра граней, так и окно данных позволяют выбрать точку мышью и прочитать соответствующее значение наклона нормали к грани ϑ и направление φ под заголовком Normal. Когда вы выбираете точку в окне просмотра данных, окно просмотра граней обновляется чтобы показать наклон в этой точке.

Кнопка найти максимум устанавливает выбор в окне распределения уклонов в точку максимума (там, где оно было изначально).

Кнопка Пометить обновляет маску областей с уклоном, подобным выбранному. Более точно, областей с уклоном укладывающихся в допуск от выбранного наклона. Окно просмотра граней после этого показывает набор граней, соответствующих отмеченным точкам (следует заметить, что набор отмеченных граней может не быть похожим в окне просмотра граней, но это лишь вследствие выбранной проекции). Средний наклон всех точек в выбранном диапазоне наклонов показывается под заголовком Средняя нормаль.