В данном документе приводится методика измерения аудиотрактов звуковых карт, используемая в обзорах раздела Мультимедиа на сайте iXBT.com.
Некоторые общие пояснения технических терминов можно найти в нашем FAQ по звуку. Для более глубокого понимания нижеизложенного можно воспользоваться следующими документами: FAQ по цифровому представлению звуковых сигналов, Personal Computer Audio Quality Measurements.
Для количественной оценки технических параметров качества звучания используется программа SpectraLab 4.32.14 (www.soundtechnology.com). Спектрограммы тестов на нелинейные искажения и шумы получаются при подаче на вход эталонного синусоидального сигнала частотой 1 кГц. Тестовый синусоидальный сигнал с амплитудой -3 дБ был получен в wav-редакторе CoolEdit 2000 генератором синусоидального сигнала Generate/Tones.
Для измерений характеристик, получаемых при прохождении сигнала по внешнему пути аудиотракта карты — из линейного выхода в линейный вход (external loopback), был применён шнурок длиной 10 см из раздельно экранированных микрофонных проводов d=6 мм. На его концах были распаяны позолоченные разъемы миниджек производства Тайвань, немного расточенные с торца.
Немного теории
Действие программы SpectraLab основано на FFT (Fast Fourier Transform — быстром преобразовании Фурье). Вспомним формулу прямого преобразования Фурье:

где — непрерывная функция на входе, например
.
A — амплитуда сигнала, например 1 Vrms, — частота, например 1000 Гц.
На её основе вводится формула дискретного преобразования Фурье:

где — дискретные значения непрерывной функции f (i) в точке i, N — количество точек,
— частота.
При этом мы можем выбирать как узкий диапазон частот для более точного исследования, так и всю доступную полосу, которая, согласно теореме Котельникова, не может превышать половину частоты дискретизации. Для максимальной производительности выбирают N, являющееся степенью числа 2 (в программах обычно предлагается ряд от 28 до 216 ).
Какие методические погрешности мы получаем? Самая большая неприятность — это рассеяние. То есть при подаче синусоиды вместо такой картинки в идеале:

возникает немного другая:

Это "просачивание" сигнала на соседние частоты спектра в английской терминологии носит название leakage. Такова плата за realtime в измерениях, который мы имеем используя FFT. То есть искажению подвергается даже представление идеального файла с чистой синусоидой, что делает невозможным определение по графику истинного значения спектрального распределения шумов на реальном сигнале.
Методы представления результатов FFT (smoothing windows)
Но не всё так плохо. В зависимости от преследуемых целей результаты могут быть представлены в соответствии с одним из методов, указанных в таблице:
Метод представления | Точность передачи по частоте спектра | Точность передачи амплитуды | Уменьшение размытия | Где применяется |
Bartlett | Плохо | Плохо | Средне | |
Blackman | Плохо | Хорошо | Превосходно | Измерение искажений (distortion) |
Flattop | Очень плохо | Превосходно | Средне | Точные измерения значений амплитуды |
Hamming | Плохо | Плохо | Плохо | |
Hanning | Плохо | Превосходно | Превосходно | Измерение искажений и шумов |
Kaiser | Плохо | Плохо | Очень плохо | |
Parzen | Плохо | Плохо | Очень плохо | |
Triangular | Плохо | Плохо | Очень плохо | |
Uniform (неизменённое представление) | Превосходно | Очень плохо | Очень плохо | Точные измерения значений частоты пиков, анализ импульсов |
Из приведённой таблицы видно, что в реальной жизни хватит всего 2-х методов: по Ханингу (Hanning) и обычного представления (Uniform). Принцип действия всех этих методов заключается в подборе такой сложной функции, которая бы дала нам оптимальный вид зависимости амплитуды от частоты.
Режимы работы с программой
Для переключения режимов работы служит меню Mode:

Real Time — измерения в реальном времени, Recorder — запись и обработка файлов, Post Process — постообработка, в которой имеется возможность использования перекрытий (FFT overlap) для более точного измерения.

Перейдём в режим Recorder и откроем тестовый файл — синусоиду с частотой 1 кГц. Нажав клавишу F4 или выбрав пункт меню Option/Settings, попадаем в настройки и устанавливаем необходимые параметры. Следует обратить внимание на частоту обработки. Если она отличается от частоты семплирования, неизбежны значительные нелинейные искажения от передискретизации.
ВНИМАНИЕ! Не рекомендуется использовать входящий в комплект SpectraLAB тестовый файл синусоиды 1 кГц 44100 Гц при измерении характеристик карт в режиме семплинга 48000 Гц.
Averaging Settings - округления по сериям измерений. FFT size — число N из формулы (2). Peak Hold — фиксировать пики — необходимо только для показа "потолка", так как измерения искажений и шумов в этом режиме получаются некорректными. Decimal Ratio — позволяет уменьшить выборку по частоте. Для исключения "пульсаций" АЧХ при максимальном FFT size следует уменьшить значение этого параметра до 32768 (можно предположить следующее: поскольку численное интегрирование очень чувствительно к шагу, деление на 216 в формуле (2) значительно ухудшает точность и устойчивость численного метода).
Особенности выбора тестового сигнала
Создадим стандартный синусоидальный сигнал 1 кГц амплитудой 0 dB (амплитуда считается относительно максимального сигнала без перегрузки для 16-битной разрядной сетки). Сигнал для тестов точно под "0" — не очень хороший выбор (исключая рекламные проспекты). Реально на студиях никто не нормализует музыкальный материал таким образом — всегда оставляют некоторый запас "сверху" (headover). Это происходит по разным причинам. И одна из них такова: старший бит несёт информацию о половине амплитуды сигнала, ошибки при считывании CD-DA интерполируются через двойной каскадный код Рида-Соломона, и при нормализованном под "ноль" сигнале щелчки со временем "эксплуатации" будут слышны все чаще и чаще. Для получения более реальных характеристик разумно использовать для измерений файл с уровнем -3dB.

Ровный спектр шумов при почти полном отсутствии гармоник идеально подходит в качестве эталонного сигнала.
Измеряемые параметры
Коэффициент нелинейных искажений (Total Harmonic Distortion, THD). Равен квадратному корню отношения суммы мощностей всех гармоник, кроме основной, к мощности основного колебания. Согласно установившейся практике подаётся сигнал частотой 1 кГц максимальной амплитуды. Характеризует нелинейность и обычно сильно зависит от частоты. Измеряется в процентах. Для цифровой техники при выходе цифрового сигнала за разрядность цифровой сетки (например, при высоких положениях регуляторов громкости в микшере или некорректных алгоритмах) характерно скачкообразное увеличение значения THD.
Отношение сигнал/шум (Signal to Noise Ratio, SNR). Показывает превышение амплитуды выходного сигнала над среднеквадратичным значением мощности шумов. Вычисляется вычитанием упомянутых величин в децибелах, поэтому является размерной величиной. Очень актуален для аналоговых устройств и АЦП/ЦАП. Так как уровень воздействия шумов на человека зависит от спектра самого шума, то для учёта субъективного восприятия (а иногда и в маркетинговых целях) применяют стандартную сетку А-взвешивания. При этом рядом с параметром должно быть указано А-weighting. Цифровые шумы не подчиняются закону геометрического сложения, как аналоговые.
Для совместной оценки шумов и искажений также измеряют полный коэффициент гармоник с учётом шумов (THD+N). Он объединяет в себе значения двух вышеописанных параметров.
Реальный сигнал включает в себя частоты, на порядок отличающиеся друг от друга по значению. Вследствие нелинейности звукового тракта могут образовываться паразитные модуляционные гармоники, делающие звук неестественным и неприятным. Для учёта такого влияния вводят коэффициент взаимной модуляции (InterModulation Distortion, IMD).
АЧХ, или амплитудно-частотная характеристика (AFC, amplitude-frequency characteristic). Представляет собой график в координатах амплитуды от частоты, построенный измерением амплитуды на выходе системы при подаче гармонического сигнала обычно представляющего собой "плавающий" синус (swept sine) с постоянной амплитудой. В идеале этот график должен быть прямой линией, при этом имеет значение не абсолютное соответствие референсному сигналу, а отклонение от наиболее ровного участка. Позволяет судить о том, насколько верно передаётся амлитуда сигнала на различных частотах спектра. При необходимости корректируется многополосным эквалайзером. К сожалению, аналоговые эквалайзеры привносят гораздо более неприятные на слух по сравнению с частотными фазовые искажения. Необходимо отметить, что цифровые эквалайзеры, работающие не в реальном времени, не вносят фазовых искажений в сигнал.
Мощность шумов квантования при оцифровке может быть уменьшена на несколько дБ за счёт оверсемплинга и последующей фильтрации неслышимых частот, что широко применяется в кодеках и ЦАП-ах. Упомянуто это для объяснения технологической необходимости установки фильтра высокого порядка (означающего спад АЧХ на высоких частотах). Однако создать идеальный фильтр (и дешевый, и эффективный) трудно, поэтому разработчики часто "залезают" даже в слышимую область спектра. Влияния подобного рода инженерных решений на качество звука нужно оценивать в каждом конкретном случае предельно аккуратно.
О применимости данной методики и корректности результатов измерений
В статье SB Live! и домашняя звуковая студия приводятся сравнение параметров аудиотракта звуковой карты SBLive!, полученных на измерительном комплексе Audio Precision, с таковыми у профессиональных и полупрофессиональных карточек. Данные, полученные нами с помощью программы SpectraLab 4.32.14, отличались от указанных в статье не более чем на 1,5%.
В любом случае наша цель состоит не в получении абсолютных значений, а в сравнении параметров звуковых карт между собой по одной и той же методике, в одних и тех же условиях. И что самое важное — результаты измерений хорошо согласуются с независимыми слуховыми экспертными оценками на качественном аудио-оборудовании.
В наших планах стоит улучшение и развитие данной методики измерений. Комментарии и поправки от квалифицированных специалистов в данной области приветствуются.