Сайт о телевидении

Сайт о телевидении

» » Ms sql превращает дробную часть в целое. Типы данных SQL. Типы данных MySQL

Ms sql превращает дробную часть в целое. Типы данных SQL. Типы данных MySQL

2012-08-16T14:46

2012-0408-16T14:46

Audiophile"s Software

Copyright 2017, Taras Kovrijenko

Полное или частичное копирование текста допускается только с письменного разрешения автора .

Пролог

Хоть интернет полнится различного рода инструкциями по проверке честности lossless аудио, проверке на апконверт и т. п., я решил написать на этот счет свою инструкцию, подойдя к рассмотрению вопроса с должной основательностью и расстановкой.

Итак, перейдем непосредственно к делу.

Что будем мерить

Сперва хочу предупредить: невозможно, полагаясь лишь на программные средства (анализаторы и т.п.), с абсолютной уверенностью судить о превосходстве качества одной версии трека над другой. Имеются ввиду, например, различные раздачи на торренте, отличающиеся как источником, так и способом, которым они были закодированы. Ни одна программа не даст Вам полного понятия о звучании трека.

О чем же в данном случае можно судить? Во-первых - о частотном диапазоне анализируемого сигнала (это единственное, что можно определить точно), о его спектральном составе, ну и, как следствие (уже с той или иной вероятностью):

1. Если это lossless трек: был ли он получен из lossless источника, или же ранее был закодирован с использованием одного из lossy алгоритмов. Имеются ввиду алгоритмы, использующие психоакустическое сжатие. Сжатие с динамическим понижением разрядности (lossy WavPack, lossyWAV) скорей всего выявить не удастся, возможно, только на слух, по фоновым шумам.

2. Если это lossy: соответствует ли материал текущему своему виду, т.е., опять же, был ли источником кодирования lossless сигнал, или это апконверт . Апконвертом является любое преобразование с повышением битрейта. Например, перекодирование MP3 128 кбит/с в 320 кбит/с. Однако, осознанное перекодирование качественного AAC, OGG или MPC 200-256 кбит/с в MP3 320 кбит/с (для лучшей совместимости с устройствами воспроизведения) - случай довольно спорный, и при отсутствии других исходников даже не осуждается. Но, конечно же, при создании раздачи подобного материала, источник надо обязательно указывать.

Кроме того, для lossy (и в особенности, для LAME MP3) можно с той или иной степенью достоверности определить параметры кодирования. А определив например такой параметр, как частота срез НЧ фильтра, и сравнив его с актуальным частотным диапазоном записи, можно в некоторых случаях выявить тот самый апконверт.

Что будем использовать

Постепенно переходим к тяжелой артиллерии. Открываем папку с треком в программе EncSpot и в контекстном меню файла жмем Lame Header . Видим следующее:

Полное описание информации отображаемой EncSpot можно почитать в отдельной статье . Здесь мы видим, опять же, что использовался кодер LAME 3.99, был применен НЧ фильтр на частоте 20.5 кГц. Качество алгоритма кодирования использовалось максимальное (Quality кратно 10), источник имел частоту дискретизации 44.1 кГц. Возвращаясь к теме частоты семплирования - очень важно, чтобы частота источника (точнее, частота потока поступившего на вход кодера) и MP3 файла совпадала. Если это не так, то был использован встроенный в LAME ресемплер, а он качеством не отличается.

Отдельно хочу сказать о параметрах Join Stereo mode и Safe Joint - для музыки сочетание этих параметров наиболее предпочтительно (JS без режима Safe допустимо только при низких битрейтах).

Все фреймы конечно же имеют битрейт 320 кбит/с.

Здесь видно, что запись имеет широкую стереопанораму, различия между каналами довольно велики, а потому большинство фреймов закодированы в режиме Simple Stereo. Большинство блоков имеют тип Long, что говорит об относительно простой форме сигнала (малое количество транзиентов).

Тут стоит обратить внимание на резервуар бит - для MP3 CBR 320 он должен активно использоваться. Также хорошо, если стоят отметки Scalefac_scale и Scfsi .

А теперь можно перейти к более детальному анализу спектра. Жмем правой кнопкой на треке->Run Srviice->Open As... и открываем его через Adobe Audition 2:

Развернем окно на весь экран и уменьшим масштаб колесиком мышки:

Перед Вами просто таки характернейший для MP3 спектр: частотный диапазон составляет ~20 кГц, при этом спектральная плотность, начиная с 16 кГц резко падает. Это обусловлено особенностями психоакустической модели используемой в MP3 - она просто таки нещадно вырезает большинство слабых гармоник с частотой выше 16 кГц. Таким образом MP3 (даже с высоким битрейтом) очень легко узнать по спектру: если на записи есть фоновые шумы, выше 16 кГц они вырезаются, и на этом уровне образуется такая себе полка. Хотя, при достаточно высоком уровне ВЧ (обычно в электронной музыке), они могут в большинстве своём и сохранится.

Давайте рассмотрим спектры еще для нескольких кодеков-битрейтов.

LAME 3.99.5, VBR V2:

Здесь видно еще более жесткое обращение с ВЧ (хотя на слух это обычно неотличимо).

LAME 3.99.5, CBR 128 kbps (-q 0):

При 128 кбит/с частоты выше 16 кГц практически всегда отсутствуют, а НЧ фильтр установлен на 17000 Гц (ширина фильтра по умолчанию - 5%, так что спад начинается с 16.15 кГц). Вдобавок здесь спектр явно прорежен уже даже в районе 8 кГц, а то и ниже, в итоге спектрограмма начинает чем-то походить на решето.

Fraunhofer MP3 Encoder, CBR 320 kbps (highest, join stereo):

Как видите, битрейт 320, а по спектру скорее похож на VBR V2 (~200 кбит/с). Кстати, это тот случай, когда результаты для спектрограммы совпадают с результатами прослушивания - качество кодера FhG заметно хуже LAME (за исключением CBR 128 кбит/с - здесь результаты прослушивания весьма спорные).

Как я уже говорил, сравнивая значение Lowpass Filter из EncSpot с фактической шириной спектра материала, можно судить о «честности» данного рипа (не апконверт). Тут же приведу соответствие популярных пресетов и стандартных частот среза для последней версии LAME:

CBR 320 - 20500 Гц
CBR 256 - 19700 Гц
CBR 192 - 18600 Гц
CBR 160 - 17500 Гц
CBR 128 - 17000 Гц
VBR V0 - 22100 Гц
VBR V2 - 18500 Гц

Если ширина спектрального диапазона не соответствует данному значению, это может говорить об апконверте. Однако, здесь довольно много «но» - ширина зависит от версии кодера, настроек (есть настройка, меняющая значение предельной частоты), самого материала в конце концов.

И последний штрих - конечно же MP3 Packer. Эта программка покажет нам, насколько эффективно сжат MP3 файл (чисто математически). Кликаем по треку правой кнопкой, выбираем Run service->MP3 Info . Видим окно:

Тут нас прежде всего интересует пункт Minimum bitrate possible - он показывает нам, какого битрейта можно достичь при перепаковке фреймов данного CBR файла в VBR фреймы (без потерь качества). Сравнив это значение с актуальным битрейтом, можно судить об эффективности сжатия. Это расхождение обычно связано с нерациональным использованием резервуара бит старыми версиями LAME. Приемлемыми можно считать отклонения до 10 кбит/с включительно (310 кбит/с для актуальных 320 кбит/с), если расхождения больше - это косвенно может говорить о низком качестве кодирования. Также обратите внимание на значение Largest frame uses (kbps) - оно указывает пиковый битрейт для трека с учетом битов из резервуара. Большое значение (>400) говорит об эффективном использовании резервуара и сложности отдельных фрагментов трека.

Теперь, что касается современных кодеров (AAC, OGG Vorbis, Musepack). Они обладают более гибкими алгоритмами и не имеют такой статичной полки на 16 кГц, как MP3 (она у них динамически перемещается, в зависимости от целевого битрейта/качества), а на высоких битрейтах (>300 кбит/с) могут быть на глаз (не говоря уже о «на слух») неотличимы от lossless (если конечно не сравнивать непосредственно со спектром источника). Так что здесь ситуация посложнее, особенно если взять такой продвинутый формат как Musepack (MPC) - он работает по несколько другому принципу, чем MP3, AAC и Vorbis. Это сказывается как на спектральном отображении, так и на звучании. Например, тот же фрагмент, MPC q 6 (~210 кбит/с) :

Преимущество перед LAME MP3 VBR V2 - очевидное, и, к тому же, ощутимое на слух. Сохранены практически все составляющие до 18 кГц (этого диапазона обычно бывает достаточно даже людей с «идеальным» слухом), а пики достигают и 20. К тому же этот кодер практически не страдает от пре-эхо - главной проблемы психоакустического lossy кодирования.

А теперь взглянем на спектры AAC и OGG Vorbis.

QuickTime AAC True VBR 127 (~350 кбит/с) :

OGG Vorbis -q9 (~350 кбит/с) :

А теперь, для сравнения, спектр оригинала :

Как видите, оба кодека охраняют весь частотный диапазон, а QAAC даже практически не урезает спектр фоновых шумов. Согласитесь: довольно трудно догадаться, что спектр QAAC принадлежит lossy источнику. А если бы на записи еще не было фоновых шумов - это не смог сделать никто (даже специальная программа). Впрочем, и на слух этот метод кодирования остается (по крайней мере, для меня) лучшим.

Касаемо определения параметров кодирования AAC, OGG и MPC - здесь инструментарий довольно скромный. Практически всю доступную информацию можно найти на вкладке Properties в foobar2000.

Lossless

О спектрах мы уже говорили, с характерными особенностями спектра MP3 (и других кодеров) Вы уже знакомы, а потому, обнаружив их в спектре lossless трека, уже сможете сделать соответствующие выводы. Но, что касается спектра апконвертов - один очень важный момент. Большинство lossless кодеров не принимают на вход PCM с плавающей точкой, а если источником является lossy, в нем с большой вероятностью присутствуют фрагменты с уровнем выходящим за 0 dBFS. После преобразования в фиксированную точку, так как «умникам», клепающим lossless из MP3, лимитирование сделать мозгов не хватает, мы получаем срезы, а прямоугольные срезы содержат полный спектр частот. В итоге на спектрограмме полученного трека мы будем видеть вертикальные полосы, простирающиеся аж до 22.05 кГц (при чем сама запись обычно уложена в диапазон до 20 кГц). Вот пример такого безобразия:

Завидев это дело, можете смело расстреливать автора раздачи из реактивного гранатомета.

Ну а теперь можно смело перейти к автоматическому анализу.

Здесь всё просто: выделяете lossless треки, нажимаете третью с конца кнопку на панели моего foobar2000 и через несколько минут видите что-нибудь эдакое:

Я специально выделил кроме lossless (TAK) еще и закодированные ранее (для получения спектрограмм выше) lossy треки - чтобы показать, насколько хорошо программа обнаруживает lossy кодирование. «95% MPEG» можно интерпретировать как «скорее всего, имело место lossy кодирование». «CDDA 100%» - означает, что материал с очень большой вероятностью (конечно не 100 %, но 99 уж точно) не был подвергнут lossy кодированию. Обмануть эту программу удается только Musepack на высоком битрейте (и то редко) или lossyWAV.

Честно говоря, программа при анализе фактически руководствуется теми же критериями, что и мы при рассмотрении спектрограммы - поиск резкого спада плотности спектра, той самой «полки» - а потому, её выводы практически всегда совпадают с заключением человека с наметанным глазом, сделанным по спектрограмме.

Целостность

Также очень важно проверять треки на наличие ошибок. Для этого выделите их в foobar2000, нажмите на выделенном правую кнопку мыши и выберите из раскрывшегося списка Utils->Verify Integrity. При наличии ошибок в файлах формата MP3 foobar2000 может их исправить. Если Вы увидите ошибку вроде «Reported length is inaccurate...», выделите треки для которых отобразилась данная ошибка, нажмите правую кнопку и выберите Utils->Fix VBR MP3 Header, после обработки проверьте трек еще раз, ошибка должна отсутствовать. Если при проверке Вы наблюдаете ошибку вида «MPEG Stream error...», её можно исправить с помощью опции Utils->Rebuild MP3 Stream. После выполнения операции исправления ошибки не забывайте повторно проверять треки.

Для других lossy форматов, а также lossless исправить ошибки в foobar2000 нельзя, но проверить всё равно стоит.

Das Ende

November 28th, 2015

Содержание:
1. 1. О lossless форматах .

2. Почему формат mp 3 давно не актуален.
Ограничения auCDtect /Как проверить винил-рип?
4. Как разделить альбомы в lossless форматах на отдельные треки?

---------------------
Основная часть материала взята с сайта http://audiophilesoft.ru/
Рекомендую почитать этот сайт на досуге.
Теперь подробно:

1. О lossless форматах.
Подробнее по ссылке:
https :// ru . wikipedia . org / wiki /Сжатие_без_потерь

О кодеках форматах сжатия:
Сравнение одиннадцати лучших lossless кодеров
http://audiophilesoft.ru/publ/my/lossless_comparison/11-1-0-68
Если кратко, предлагаю выбрать Flac

2. Почему формат mp 3 давно не актуален.
Лучше отказаться от этого формата, кроме случаев, есливаш плеер читает только его.
Во первых, по сравнению с
lossless музыкой, формат mp 3(как в прочем и другие lossy форматы, за редким исключением) даже в максимальном качестве(320кбит/с) имеет:
-меньшую детальность звука
-меньшую разность между отдельными резкими звуками(нотами)
-вокал более зажат, менее «живой»(как на записи)
-также, есть информация, что старые кодеки для
mp 3 вроде Fgh , сжимают якобы «менее качественно».
-эффект пре-эхо(Примечание: лично я его не смог уловить, как не пытался, даже на тестовом сэмплах отсюда http://audiophilesoft.ru/publ/my/best_lossy_encoder_at_200kbps/11-1-0-62)

Дискуссий на тему отличий качества mp 3 от lossless много в сети. Важно отметить, что для качественного личного сравнения, нужно лично проверить оригинал песнианализатором спектра(см. ниже), затем, перекодировать его в mp 3 последним кодеком L ame 3.99.5, выровнять громкость треков(т.к. субьективно может звучать тот трек, который громче)....
Подробнее, как правильно проводится слепой
ABX тест: http://audiophilesoft.ru/publ/my/abx/11-1-0-37

Во вторых, если мало место на диске, есть lossy (с потерями) кодеки более современные, которые сжимают более качественно: musepack (mpc ), ogg , acc
http://habrahabr.ru/post/118454/

3. Как проверить музыку анализатором спектра?
Без проверки скачанной музыки анализатором спектра - можно вместо качественной музыки скачать Апконверт.
Что такое апконверт:
http :// alexstudio . ucoz . net / forum /18-89-1

От себя хочу отметить, что в сети дофига апконверта(«музыкального мусора»), на торрентах в разделах lossless , в сети DC ++. Особенно много на сборниках в формате mp 3, также в редких записях, в бардовской песни.
Поэтому все скачанное нужно проверять лично.

Я использую отдельный анализатор спектра: программу auCDtect Task Manager 1.5 . 1RC4 build 1.5.1.5. По моим наблюдениям, она более корректно работает(определяет форматы), чем последняя версия 1.6.0 RC1 (decoders: December 2014).

Как настроить программу


Заходим Настройки- Спектрограмма-Условия сохр. Выбираем в раскрывающемся списке «Всегда».
Можно выбрать папку сохранения, по умолчанию картинки будут сохраняться в папке с проверяемой музыкой: Настройки- Спектрограмма-Сохранять в папку- \\ Spectrogram

Настраиваем папку для временных файлов(Настройки-Общие-Папка для временных файлов ).
Лучше указать диск, где не меньше 0,8-1,5Гб свободного места, т.к.

1.Для распаковки одного файла в lossless, требуется размер в 1,5 раза больше, чем сам файл
2.программа распаковывает по 2 файла сразу

Например, по 2 альбома во flac , по 500Мб каждый(во flac , в wav он будет около 750мб) и того получаем 1,5Гб для временных файлов).

Если требуется проверить винил рип, где размер альбома может достигать 1,4 Гб, нужно соответственно 2,1Гб свободного места.

Настраиваем скачанную программу, в том числе включаем сохранение файлов с картинками спектрограмм проверяем файлы, и нажимаем «Выход». Программа создает картинки со спектрами в папке с музыкой.

Имеет смысл анализировать по факту 2 вещи на апконверт:
lossless музыку (форматы wav , flac , ape , и т.д.)
mp 3 в максимальном битрейте 320 или lossy форматы в качественном битрейте

Как интерпретировать результаты спектрограммы:
Для lossless :
Получения в auCDtect значения
CDDA 99-100% для lossless файла , не дает 100% гарантии подлинности(что запись получена из настоящего компакт диска: 16бит 44.1КГц битрейта 1411кбит/с).
Для
lossless это говорит о том, что еще как вариант файл мог был получен апконвертом, но из качественных lossy кодеков с битрейтом 350-400 кбит/с (musepack , ogg ).

Для mp 3:
по фактической ширине спектра материала, можно судить о «честности» данного рипа (не апконверт).
Примерное соответствие популярных пресетов и стандартных частот среза для последней версии кодека LAME 3.99.5 для
mp 3 для различных битрейтов:

Ограничения auCDtect / Как проверить винил-рип?

К сожалению, программа не понимает форматы 24битной музыки (винил рипы/ vinil rip ) а также некоторые lossy форматы, вроде. wma
Для проверки спектрограмм данной музыки можно воспользоваться аудио-редактором Adobe Audition .
1.Нужно переконвертировать музыку/альбом сначала в формат
wav , например, с помощью foobar 2000 (настройки: converter setup : wav , output bit depth (битность): auto , dither (дизеринг): never )
2.Затем открыть получившийся файл
wav в Adobe Audition .
3.Нажать
Alt - Z (Окно-Частотный Анализ).

4. Как разделить ape или flac образ на треки?

Два способа:
1.С помощью CueTools .Плюсом этого способа является возможность настроить теги файлов, выбрать обложку, а также сохранитьпаузы между треками. http://audiophilesoft.ru/publ/my/image_splitting/11-1-0-85
2.
C помощью Foobar 2000 . Плюсом этого способа является возможность нарезать винил рипы(24бита), а также быстрота(если, например, нам нужен только один трек со всего альбома). Сначала нужно подключить к ней соответствующий кодек. Например, для flac , это кодек

Начнем с простых способов, не имеющих отношения к информатике и вычислительной технике. Наиболее очевидно наложить такие звуки, которые в воспроизведении грампластинки в обратную сторону на бытовом электропроигрывателе или специальной аппаратуре дадут разборчивую человеческую речь.

Бэкмаскинг

Потенциал подобной техники увидел ещё изобретатель фонографа Томас Эдисон, а впервые ею воспользовались пионеры электронной музыки в 50-ых годах прошлого века, хотя, конечно, популяризации приемов бэкмаскинга мы обязаны группе Beatles. В частности, под воздействием марихуаны Леннон прокручивал пленки задом наперед, и полученный звук его очень заинтересовал. Первой песней со скрытым сообщением была Rain .

Цензуру таким образом обходил, например, Фрэнк Заппа, звукозаписывающий лейбл которого не пропустил некоторые строчки.


Better look around before you say you don"t care.
Shut your f…ing mouth "bout the length of my hair.
How would you survive, if you were alive, shitty little person?

Менее известен прием наложения человеческой речи в ускоренном или замедленном виде, которым воспользовался Джими Хендрикс для песни Third Stone from the Sun. Если ускорить версию трэка в издании The Jimi Hendrix Experience: 1966–1967 в два раза (или проигрывать пластинку на 33⅓ оборота в минуту на скорости в 45), можно услышать отчетливый диалог космических пришельцев, изображаемых Джими и его менеджером.


Хендрикс: Star fleet to scout ship, please give your position. Over.
Чэндлер: I am in orbit around the third planet of star known as Sun. Over.
Хендрикс: May this be Earth? Over.
Чэндлер: Positive. It is known to have some form of intelligent species. Over.
Хендрикс: I think we should take a look. (Джими издает звукоподражания космическому кораблю)

Спад интереса к скрытию посланий в обратном направлении или в проигрывании с повышенной скоростью связан, в первую очередь, с переходом на цифровые носители, проигрыватели которых далеко не всегда имеют функционал реверсирования проигрывания и его ускорения. Не стоит скрывать создание в конце 80-х в Калифорнии и некоторых других штатах законопроектов против заложения в музыку сообщений: фанатизм поиска пасхалок помог находить «послания антихриста» практически везде. Начало слухам о смерти Пола Маккартни положил именно бэкмаскинг.

Рисунки в спектрограмме

Получить спектрограмму легко, возможно ли восстановить звук по спектрограмме? Да, но со значительными аппроксимациями, что никак не помешает создать музыку, которую нужно не слушать - всё равно получится жуткий металлический звон, - а смотреть. Такой музыкой является, к примеру трэк стороны B сингла Windowlicker британского электронного музыканта Aphex Twin, чаще всего называемый «Уравнение» или «Формула», но имеющий более эпатажное название:

Пропустите до 5:30, чтобы увидеть патентованную ухмылку Ричарда. Прием не был нов даже в 99-ом году: к примеру, вот конец трэка Windowlicker:

Легко догадаться, что будет в трэке Look глитч-альбома Songs About My Cats.

Использование особенностей носителя

На виниловой пластике возможно напечатать две дорожки, как это иногда случалось. Например, в оригинальном издании The Monty Python Matching Tie and Handkerchief 1973 года мало того, что не были подписаны стороны пластинок, и не имелось списка трэков, так ещё и на стороне B были нанесены две паралелльные друг другу концентрические дорожки. Для прослушивания скрытой песни на «трехсторонней» пластинке была необходима лишь удачная установка иглы.

Такую же выходку провернул Mad Magazine на диске It’s a Super Spectacular Day, только дорожек было 8. На каждой из них красочно расписывались неприятности, которые могут с вами сегодня произойти. Записи в несколько дорожек были популярны ещё в 50-ых, но, как правило, использовались лишь в пластинках с аудиорассказами для детей, что позволяло получить несколько различных историй с одной двухсторонней пластинки.

Формат данных компакт-диска, описанный в Красной книге, допускает так называемый прегап - отступ от первого трэка. По умолчанию, он длится две секунды и содержит тишину. Множество музыкантов размещали в прегапе аудиоматериалы. К сожалению, обновление в Windows 95 сделало невозможным доступ системы к прегапу первого трэка, видимо, ради поддержки формата CD-Extra. Однако цифровые данные можно размещать следующим способом.

Винил, модемный сигнал, ZX Spectrum и программы

Как записать текстовый файл на виниловой пластинке? Американский коллектив Information Society смог без труда это сделать: название трэка 300bps N, 8, 1 (Terminal Mode or Ascii Download) альбома Peace and Love, Inc. явным образом указывало на то, как можно прочесть их послание. Модем на 300 бод позволял получить текстовый файл, содержавший рассказ группы о давлении на них бразильских государственных структур. Непонятно лишь, почему они выбрали столь странный формат для рассказа.

Скрытый текст

Atz Ok Atx3dt Connect 300

So we’re supposed to play in curitiba in 18 hours, but our bus is being held hostage by the local promoters. they’ve formed some unholy alliance with the brazilian counterpart of ascap: the prs. Rently the prs has the legal power to arrest people, and they want a piece of the national tour promoter’s money. the local security force, “gang mexicana”, has been bought out for 180 Zados and a carton of marlboros each. the only faction still operating in our defense is “big john”, our personal security man, and he’s hiding in his room because a local gang is out Is blood because of a 1982 knifing incident in which he was involved. our 345-pound road manager, rick only had this to say: “you wanted the life of a rock star!”. paul, jim and I real That this was one situation we were going to have to get out of ourselves.

We convened a hasty conference in the hotel lobby. paul suggested contacting our national tour promoter in sao paulo, but we remembered that he was in recife with faith no more, who had just arr For their brazilian tour. we thought about contacting our brazilian record company in rio, but they weren’t home. our ever-diligent american manager was arranging help of numerous forms, but he N new york, and just too far away to get anything moving in time.

And there were 6000 kids in curitiba who just wouldn’t understand.

We knew it was time for action. paul went up to the prs guys and invited them into the bar to discuss it like civilized men over a few brazilian drinks, offering each of them a cigar on his way. Amused prs heavies seemed to like the idea of a few free drinks, even if they knew they would never give us our bus back. when paul winked at jim and I on his way in, we went into action.

I stole off to my room to prepare while jim went into action. creeping carefully through a service duct, he managed to gain a vantage point some three meters above the bus, and dropped carefully The roof. after using his all-purpose swiss army knife (affectionately known as the “skit knife”) to jimmy open the roof hatch, he went through the darkened inside of the bus and remo He inside engine service panel. using some spare electronic parts he found while on an island in the amazon, he wired the entire bus for remote control, not unlike a remote control toy car.

At this point, he asked himself “now how shall I get out of here? !? “

Paul was having difficulties of his own.

“couldn’t you see your way clear to letting us fulfill our contractual obligations in curitiba? think of the kids!”

Through our translator, fabio, the prs man, aldo, said:

No. you americans think you own the world. hah! we’ll burn down our rain forest if we damn well please. we need room for cows!!! we want a mcdonald’s on every… oh, sorry, yes anyway, no. Ed 40% of your concert receipts to give to david bowie,” he said, winking to the local promoter, phillipe.

As paul continuted this elaborate distraction, jim effected an escape from the heavily guarded bus by crawling down into the cargo bay, cutting a hole in the floor with the swiss army knife’s ar Der, slipping into the manhole cover situated under the bus, and walking up to the hotel’s basement from there. jim called up to me in my room and gave the signal. we were now to meet at the bac Rance, with our tech guys. but first, paul would need some help getting away from his unwelcome guests, as things were getting ugly.

“he says he has lost his patience, and that he can think of other ways of extracting payment from you kurt and jim physically,” our trembling interpreter said.

The moment had come. jim began operating the bus from his back entrance vantage point. as the remote-controlled bus lurched towards the parking lot exit, the superstitious security youths fled i Ror. paul was pulling anxiously on his collar as the prs man began describing his collection of world war ii nazi ceremonial knives when a sudden crash split the tableau.

Jim had purchased me the gift of a complete black ninja stealth assassin outfit in aracaju. I had been gearing up and crawling through the air conditioning ducts all this time. as I crashed thro He cheap imitation-styrofoam hung ceiling tiles, skates first, I flashed ninja stars all about me. in the ensuing panic, paul escaped to the pre-arranged bus pick-up point. unfortunately, my ska Ere a poor choice of foot gear for escaping over the broken glass of the table I had landed on. were it not for the confusion and the ninja-star-inflicted-wounds delivered to the bad guys, I wou Ve been set upon while floundering on the glass-strewn carpet. as it happened, however, I leapt through the open door of the careening bus as it departed the city of maringa forever.

If only we had managed to get our equipment in the bus, too...

Every word of this story is true.

Имя трэка CLOAD «Q» альбома Information Retrieved Pt. B - это команда загрузки файла Q в Бейсике TRS-80, персонального компьютера начала 80-ых. Как видно, инди-группа Pinback зачем-то уместила на альбоме игру для давно устаревшего компьютера.

В ранние годы распространения персональной компьютерной техники звук для записи кассет ZX Spectrum вещался даже по телевидению. Встречались и трэки, целиком являющиеся программами, и если это были альбомы на виниле, их нужно было переписать на кассету. Чаще всего этим приемом пользовались коллективы из Великобритании.

К примеру, шестой трэк британских изданий альбома XL1 Пита Шелли содержал пульсации звуков, которые, будучи загруженными в «Спектрум», являли собой рудиментарную графику и тексты песен, воспроизводившиеся синхронно с проигрыванием альбома. Для таких же информационных целей служил трэк Hectic Electric с альбома New Anatomy группы Inner City Unit: программа содержала расписание выступлений, описание коллектива, трэков и т.д.

Thompson Twins выпустили на виниле целую видеоигру . Это типичный текстовый квест, который вряд ли будет интересен людям, никогда не оставлявшим на тетрадном листке карту ходов после часов игры.


Сингл Camouflage Криса Сиви включал созданную музыкантом ужасненькую игрушку

Как получить частотные спектры аудио файла

Получить спектр трэка или просто проверить качественные характеристики аудио файла можно с помощью различных программ. Попробуем рассмотреть наиболее доступные, интересные и удобные программы.

Sonic Visualiser

Бесплатная программа для визуализации и анализа аудио-музыкальным данных. Обладает очень развитыми функциями спектрального анализа.

Мультиплатформенная, поддерживает форматы: aiff, au, avr, caf, flac, htk, iff, mat, mp3, oga, ogg, paf, sd2, sds, sf, voc, w64, wav, wve, xi.

Настройки спектрограммы по-настоящему инженерные: можно выбирать глубину нахлёста окон, шкалы просмотра и способы отбора значений бинов, очень удобна навигация. Отдельно нужно отметить высокую скорость прорисовки и расчёта спектра.

К официальной информации, пожалуй нужно добавить: уверенно работает на win7 x64, не требует установки (выполнена в виде единого запускаемого файла), имеет полностью русскоязычный интерфейс и не оставляет програмных файлов в папках с проверяемым аудио материалом.

Программа для мастеринга, анализа и реставрации аудио материала.

Можно затащить файл мышкой в окно программы или открыть через окно импорта: File > Open

Ползунок масштабирования по шкале времени:

Ползунок масштабирования по шкале частот:

Adobe Audition

Аудиоредактор, предназначенный для редактирования, микширования и восстановления цифрового звука.

Затягиваем мышкой исследуемый файл на ярлык программы и видим:

Можно затащить файл мышкой в окно программы или открыть через окно импорта: Файл > Открыть...

Переходим к спектру. Кликаем по кнопке в верхней части программы:

Или открываем: Вид > Показать частотный спектр

Для детального рассмотрения спектра, кликаем правой кнопкой мыши по шкале частот и выбираем на вкладке строку Увеличение (Частота)

Теперь достаточно ухватиться левой кнопкой мыши за шкалу частот и перемещением вверх, вниз детально ее рассмотреть. В нижней правой части находится кнопка Увеличение (Время) - масштабирование по шкале времени.



Алексей Лукин

Спектроанализатор - прибор для измерения и отображения спектра сигнала - распределения энергии сигнала по частотам. В этой статье рассматриваются основные виды анализаторов спектра и иллюстрируется их применение для редактирования и реставрации звука. Особое внимание уделяется современным анализаторам, основанным на FFT - быстром преобразовании Фурье.

Зачем анализировать спектр?

Традиционно в цифровой звукозаписи аудиодорожка представляется в виде осциллограммы, отображающей форму звуковой волны (waveform), то есть зависимость амплитуды звука от времени. Такое представление достаточно наглядно для опытного звукорежиссёра: осциллограмма позволяет увидеть основные события в звуке, такие как изменения громкости, паузы между частями произведения и зачастую даже отдельные ноты в сольной записи инструмента. Но одновременное звучание нескольких инструментов на осциллограмме "смешивается" и визуальный анализ сигнала становится затруднительным. Тем не менее, наше ухо без труда различает отдельные инструменты в небольшом ансамбле. Как же это происходит?

Когда сложное звуковое колебание попадает на барабанную перепонку уха, оно с помощью серии слуховых косточек передаётся на орган, называемый улиткой. Улитка представляет собой закрученную в спираль эластичную трубочку. Толщина и жёсткость улитки плавно меняются от края к центру спирали. Когда сложное колебание поступает на край улитки, это вызывает ответные колебания разных частей улитки. При этом резонансная частота у каждой части улитки своя. Таким образом улитка раскладывает сложное звуковое колебание на отдельные частотные составляющие. К каждой части улитки подходят отдельные группы слуховых нервов, передающие информацию о колебаниях улитки в головной мозг (более подробно о слуховом восприятии можно прочитать в статье "Основы психоакустики " И. Алдошиной в журнале "Звукорежиссер" №6, 1999). В результате в мозг поступает информация о звуке, уже разложенная по частотам, и человек легко отличает высокие звуки от низких. Кроме того, как мы вскоре увидим, разложение звука на частоты помогает различить отдельные инструменты в полифонической записи, что значительно расширяет возможности редактирования.

Полосовые спектроанализаторы

Первые звуковые анализаторы спектра разделяли сигнал на частотные полосы с помощью набора аналоговых фильтров. Дисплей такого анализатора (рис. 1) показывает уровень сигнала во множестве частотных полос, соответствующих фильтрам.

Рис. 1. Третьоктавный анализатор Specan32, эмулирующий известный прибор KlarkTeknik DN60

На рис. 2 приведён пример частотных характеристик полосовых фильтров в анализаторе, удовлетворяющем стандарту ГОСТ 17168-82. Такой анализатор называется третьоктавным, так как в каждой октаве частотного диапазона имеется три полосы. Видно, что частотные характеристики полосовых фильтров перекрываются; их крутизна зависит от порядка используемых фильтров.

Рис. 2. Частотные характеристики фильтров третьоктавного спектроанализатора

Важным свойством спектроанализатора является баллистика - инерционность измерителей уровня в частотных полосах. Она может регулироваться заданием скорости нарастания (атаки) и спада уровня. Типичное время атаки и спада в таком анализаторе - порядка 200 и 1500 мс.

Полосовые спектроанализаторы часто применяются для настройки АЧХ (амплитудно-частотной характеристики) акустических систем на концертных площадках. Если на вход такому анализатору подать розовый шум (имеющий одинаковую мощность в каждой октаве), то дисплей покажет горизонтальную линию, с возможной поправкой на вариацию шума во времени. Если розовый шум, проходя через звукоусилительную систему зала, исказился, то изменения его спектра будут видны на анализаторе. При этом анализатор, как и наше ухо, будет малочувствителен к узким провалам АЧХ (менее 1/3 октавы).

Преобразование Фурье

Преобразование Фурье - это математический аппарат для разложения сигналов на синусоидальные колебания. Например, если сигнал x (t ) непрерывный и бесконечный по времени, то его можно представить в виде интеграла Фурье:

Интеграл Фурье собирает сигнал x (t ) из бесконечного множества синусоидальных составляющих всевозможных частот ω , имеющих амплитуды X ω и фазы φ ω .

На практике нас больше интересует анализ конечных по времени звуков. Поскольку музыка не является статичным сигналом, её спектр меняется во времени. Поэтому при спектральном анализе нас обычно интересуют отдельные короткие фрагменты сигнала. Для анализа таких фрагментов цифрового аудиосигнала существует дискретное преобразование Фурье :

Здесь N отсчётов дискретного сигнала x (n ) на интервале времени от 0 до N -1 синтезируются как сумма конечного числа синусоидальных колебаний с амплитудами X k и фазами φ k . Частоты этих синусоид равны kF/N , где F - частота дискретизации сигнала, а N - число отсчётов исходного сигнала x (n ) на анализируемом интервале. Набор коэффициентов X k называется амплитудным спектром сигнала . Как видно из формулы, частоты синусоид, на которые раскладывается сигнал, равномерно распределены от 0 (постоянная составляющая) до F /2 - максимально возможной частоты в цифровом сигнале. Такое линейное расположение частот отличается от распределения полос третьоктавного анализатора.

FFT-анализаторы

FFT (fast Fourier transform) - алгоритм быстрого вычисления дискретного преобразования Фурье. Благодаря ему стало возможным анализировать спектр звуковых сигналов в реальном времени.

Рассмотрим работу типичного FFT-анализатора. На вход ему поступает цифровой аудиосигнал. Анализатор выбирает из сигнала последовательные интервалы («окна») , на которых будет вычисляться спектр, и считает FFT в каждом окне для получения амплитудного спектра X k . Вычисленный спектр отображается в виде графика зависимости амплитуды от частоты (рис. 3). Аналогично полосовым анализаторам, обычно используется логарифмический масштаб по осям частот и амплитуд. Но из-за линейного расположения полос FFT по частоте спектр может выглядеть недостаточно детальным на нижних частотах или излишне осциллирующим на верхних частотах.

Рис. 3. Дисплей FFT-анализатора

Если рассматривать FFT как набор фильтров, то, в отличие от полосовых фильтров третьоктавного анализатора, фильтры FFT будут иметь одинаковую ширину в герцах, а не в октавах. Поэтому розовый шум на FFT-анализаторе будет уже не горизонтальной линией, а наклонной, со спадом 3 дБ/окт. Горизонтальной линией на FFT-анализаторе будет белый шум - он содержит равную энергию в равных линейных частотных интервалах.

Параметр N - число анализируемых отсчётов сигнала - имеет решающее значение для вида спектра. Чем больше N , тем плотнее сетка частот, по которым FFT раскладывает сигнал, и тем больше деталей по частоте видно на спектре. Для достижения более высокого частотного разрешения приходится анализировать более длинные участки сигнала. Если сигнал в пределах окна FFT меняет свои свойства, то спектр будет отображать некоторую усреднённую информацию о сигнале со всего интервала окна.

Когда нужно проанализировать быстрые изменения в сигнале, длину окна N выбирают маленькой. В этом случае разрешение анализа по времени увеличивается, а по частоте - уменьшается. Таким образом, разрешение анализа по частоте обратно пропорционально разрешению по времени. Этот факт называется соотношением неопределённостей .

Весовые окна

Один из простейших звуковых сигналов - синусоидальный тон. Как будет выглядеть его спектр на FFT-анализаторе? Оказывается, это зависит от частоты тона. Мы знаем, что FFT раскладывает сигнал не по тем частотам, которые на самом деле присутствуют в сигнале, а по фиксированной равномерной сетке частот. Например, если частота дискретизации равна 48 кГц и размер окна FFT выбран 4096 отсчётов, то FFT раскладывает сигнал по 2049 частотам: 0 Гц, 11.72 Гц, 23.44 Гц, ..., 24000 Гц.

Если частота тона совпадает с одной из частот сетки FFT, то спектр будет выглядеть "идеально": единственный острый пик укажет на частоту и амплитуду тона (рис. 4, белый график).

Если же частота тона не совпадает ни с одной из частот сетки FFT, то FFT "соберёт" тон из имеющихся в сетке частот, скомбинированных с различными весами. График спектра при этом размывается по частоте (рис. 4, зелёный график). Такое размытие обычно нежелательно, так как оно может закрыть собой более слабые звуки на соседних частотах. Можно также заметить, что амплитуда максимума зелёного графика ниже реальной амплитуды анализируемого тона. Это связано с тем, что мощность анализируемого тона равна сумме мощностей коэффициентов спектра, из которых этот тон составлен.

Рис. 4. Спектр синусоидального тона различных частот с весовыми окнами и без них

Чтобы уменьшить эффект размытия спектра, сигнал перед вычислением FFT умножается на весовые окна - гладкие функции, похожие на гауссиан, спадающие к краям интервала. Они уменьшают размытие спектра за счёт некоторого ухудшения частотного разрешения. Если рассматривать FFT как набор полосовых фильтров, то весовые окна регулируют взаимное проникновение частотных полос.

Простейшее окно - прямоугольное: это константа 1, не меняющая сигнала. Оно эквивалентно отсутствию весового окна. Одно из популярных окон - окно Хэмминга. Оно уменьшает уровень размытия спектра примерно на 40 дБ относительно главного пика.

Весовые окна различаются по двум основным параметрам: степени расширения главного пика и степени подавления размытия спектра ("боковых лепестков") . Чем сильнее мы хотим подавить боковые лепестки, тем шире будет основной пик. Прямоугольное окно меньше всего размывает верхушку пика, но имеет самые высокие боковые лепестки. Окно Кайзера обладает параметром, который позволяет выбирать нужную степень подавления боковых лепестков.

Другой популярный выбор - окно Хана. Оно подавляет максимальный боковой лепесток слабее, чем окно Хэмминга, но зато остальные боковые лепестки быстрее спадают при удалении от главного пика. Окно Блэкмана обладает более сильным подавлением боковых лепестков, чем окно Хана.

Для большинства задач не очень важно, какой именно вид весового окна использовать. Главное, чтобы оно было. Популярный выбор - Хан или Блэкман. Использование весового окна уменьшает зависимость формы спектра от конкретной частоты сигнала и от её совпадения с сеткой частот FFT.

Рисунок 4 сделан для синусоид, однако, исходя из него, нетрудно представить, как будет выглядеть спектр реальных звуковых сигналов. Каждый пик в спектре будет иметь некоторую размытую форму, в зависимости от своей частоты и выбранного весового окна.

Чтобы компенсировать расширение пиков при применении весовых окон, можно использовать более длинные окна FFT: например, не 4096, а 8192 отсчета. Это улучшит разрешение анализа по частоте, но ухудшит по времени.

Спектрограмма

Часто возникает необходимость проследить, как спектр сигнала меняется во времени. FFT-анализаторы помогают сделать это в реальном времени при воспроизведении сигнала. Однако в ряде случаев оказывается удобна визуализация изменения спектра во всём звуковом отрывке сразу. Такое представление сигнала называется спектрограммой . Для её построения применяется оконное преобразование Фурье : спектр вычисляется от последовательных окон сигнала (рис. 5), и каждый из этих спектров образует столбец в спектрограмме.

Рис. 5. Вычисление спектрограммы сигнала

По горизонтальной оси спектрограммы откладывается время, по вертикальной - частота, а амплитуда отображается яркостью или цветом. На спектрограмме гитарной ноты на рис. 6 видно развитие звучания: оно начинается с резкой атаки и продолжается в виде гармоник, кратных по частоте основному тону 440 Гц. Видно, что верхние гармоники имеют меньшую амплитуду и затухают быстрее, чем нижние. Также на спектрограмме прослеживается шум записи - равномерный фон тёмно-синего цвета. Справа показана шкала соответствия цветов и уровней сигнала (в децибелах ниже нуля).

Рис. 6. Спектрограмма гитарной ноты с разными размерами окна FFT

Если менять размер окна FFT, становится хорошо видно, как меняется частотное и временное разрешение спектрограммы. При увеличении окна гармоники становятся тоньше, и их частота может быть определена более точно. Однако размывается во времени момент атаки (в левой части спектрограммы). При уменьшении размера окна наблюдается обратный эффект.

Особенно полезна спектрограмма при анализе быстро меняющихся сигналов. На рис. 7 показана спектрограмма вокального пассажа с вибрато. По ней легко определить такие характеристики голоса, как частота и глубина вибрато, его форма и ровность, наличие певческой форманты. По изменению высоты основного тона и гармоник прослеживается исполняемая мелодия.

Рис. 7. Спектрограмма вокального пассажа с вибрато

Применения спектрограммы

Современные средства реставрации звука, такие как программа iZotope RX , активно используют спектрограмму для редактирования отдельных частотно-временных областей в сигнале. С помощью этой техники можно найти и подавить такие нежелательные призвуки, как звонок мобильного телефона во время важной записи, скрип стула пианиста, кашель в зрительном зале и т.п.

Проиллюстрируем использование спектрограммы для удаления свиста поклонников из концертной записи.


Рис. 8. Удаление нежелательных призвуков с помощью спектрограммы

На рис. 8 свист легко находится: это светлая кривая линия в районе 3 кГц. Если бы частота свиста была постоянной, то его можно было бы подавить с помощью режекторного фильтра. Однако в нашем случае частота меняется. Для выделения свиста на спектрограмме удобно воспользоваться инструментом «волшебная палочка» из программы iZotope RX II. Одно нажатие приводит к выделению основного тона свиста, повторное нажатие выделяет гармоники. После этого свист можно удалить, просто нажав на клавишу Del. Однако более аккуратный способ - воспользоваться модулем Spectral Repair: это позволит избежать "дыр" в спектре после удаления свиста. После применения этого модуля в режиме ослабления с вертикальной интерполяцией (Attenuate vertically) свист практически полностью исчезает из записи: как визуально, так и на слух.

Еще одно полезное применение спектрограммы - анализ присутствия в записи следов компрессии MP3 или других кодеков с потерями. У большинства записей оригинального (несжатого) качества частотный диапазон простирается до 20 кГц и выше; при этом энергия сигнала плавно спадает с ростом частоты (как на рис. 6, 7). В результате психоакустической компрессии верхние частоты сигнала квантуются сильнее нижних, и верхняя граница спектра сигнала обнуляется (как на рис. 8). При этом частота среза зависит от содержания кодируемого сигнала и от битрейта кодера. Ясно, что кодер стремится обнулять только те частоты в сигнале, которые в данный момент не слышны (замаскированы). Поэтому частота среза, как правило, меняется во времени, что образует на спектрограмме характерную "бахрому" с островками энергии на тёмном фоне.

Аналогичная ситуация иногда возникает и с низкочастотными помехами, такими как задувание ветра в микрофон или постоянная составляющая (смещение по постоянному току, DC offset). Они могут располагаться на инфранизких частотах и не обнаруживать себя без помощи спектроанализатора или осциллографа.

Заключение

Среди опытных звукорежиссёров старой школы распространено мнение, что анализировать и редактировать сигналы следует исключительно на слух, не полагаясь на индикаторы и анализаторы. Разумеется, анализаторы - не панацея в случае отсутствия слуха. Вряд ли кто-то серьёзно воспринимает идею сведения композиции "по приборам".

Спектр и спектрограмма - способы представления звука, более близкие к слуховому восприятию, нежели осциллограмма. Надеюсь, что эта статья откроет новые возможности в анализе и редактировании звука для тех, кто ранее с этими представлениями не работал.