Сайт о телевидении

Сайт о телевидении

» » Цифровой звук – обо всём по-порядку. Цифровая запись информации

Цифровой звук – обо всём по-порядку. Цифровая запись информации

Занимаясь музыкой, бывает очень полезно представлять себе в целом, что такое звук и как происходит запись звука на компьютере. Имея такие знания, становится намного проще понять, что такое, например, компрессия или как появляется клиппинг. В музыке, как и почти в любом деле, зная основы, проще идти вперёд.

Что такое звук?

Звук - это физические колебания среды, распространяющиеся в виде волн. Мы улавливаем эти колебания и воспринимаем их как звук . Если же попытаться графически изобразить звуковую волну, мы получим, как это ни удивительно, волну .

Синусоидальная звуковая волна

Выше изображена синусоидальная звуковая волна, звучание которой можно услышать из аналоговых синтезаторов или из телефонной трубки стационарного телефона, если вы им ещё пользуетесь. Кстати, в телефоне звучит , говоря техническим, а не музыкальным языком.

Звук обладает тремя важными характеристиками, а именно: громкость, высота и тембр - это субъективные ощущения, но они имеют своё отражение в физическом мире в виде физических свойств звуковой волны.

Амплитуда

То что воспринимается нами как громкость - это сила колебаний или уровень звукового давления , который измеряется в (дБ).

Графически изображается волнами разной высоты:

Чем выше амплитуда (высота волны на графике), тем громче воспринимается звук, и наоборот, чем меньше амплитуда, тем тише звук. Конечно, на восприятие громкости влияет ещё и частота звука, но это особенности нашего восприятия.

Примеры различной громкости, в децибелах:

Звук Громкость (дБ) Эффект
Сельская местность вдали от дорог 25 дБ Почти не слышно
Шёпот 30 дБ Очень тихо
Офис в рабочее время 50-60 дБ Уровень шума остаётся комфортным до 60 дБ
Пылесос, фен для волос 70 дБ Назойливый; мешает говорить по телефону
Кухонный комбайн, блендер 85-90 дБ Начиная с громкости в 85 дБ при длительном (8 часов) прослушивании начинается повреждение слуха
Грузовик, бетономешалка, вагон метро 95-100 дБ Для звуков от 90 до 100 дБ рекомендуется воздействие не более 15 минут на незащищённое ухо
Бензопила, отбойный молоток 110 дБ Регулярное воздействие звуков громче 110 дБ на протяжении более 1 минуты вызывает риск необратимой потери слуха
Рок концерт 110-140 дБ Болевой порог начинается около 125 дБ

Частота

Когда мы говорим, что звук «выше» или «ниже», то понимаем о чём речь, но графически это отображается не высотой, а расстоянием и частотой:

Высота ноты (звука) — частота звуковой волны

чем меньше расстояние между звуковыми волнами, тем выше частота звука или, просто, выше звук.

Думаю, все знают, что человеческое ухо способно воспринимать звуки частотой приблизительно от 20 Гц до 20 кГц (в исключительных случаях - от 16 Гц до 22 кГц), а музыкальные звуки находятся в интервале от 16,352 Гц («до» субконтроктавы) до 7,902 кГц («си» пятой октавы).

Тембр

И последняя важная нам характеристика - тембр звука. Говоря словами, это то, как «окрашен» звук, а графически выглядит как различная комплексность, сложность звуковой волны. Вот, например, графическое отображение звуковых волн скрипки и рояля:

Тембр звука — комплексность (сложность) звуковой волны

Посложнее синусоиды, не правда ли?

Существует несколько способов записи звука: нотная запись, аналоговая запись и цифровая запись.

Нотная запись - это просто данные о частоте, длительности и громкости звуков, которые необходимо воспроизвести на каком-либо инструменте. В компьютерном мире есть аналог - MIDI данные. Но рассмотрение этого вопроса выходит за рамки данной статьи, разберём его подробно в другой раз.

Аналоговая запись - по сути своей запись физических колебаний как они есть на какой-либо носитель: виниловую пластинку или магнитную ленту. Тут сразу должно начаться обильное слюноотделение у любителей тёплого лампового звука, но мы не из таких и , что аналоговые приборы имеют сильную погрешность и принципиальные ограничения, это вносит искажения и ухудшает качество записи, а физические носители со временем изнашиваются, что ещё сильней снижает качество фонограммы, поэтому аналоговая запись сейчас ушла в прошлое.

Цифровая запись звука - технология, которая дала возможность любому попробовать себя звукоинженером или продюсером. Так как же она работает? Ведь компьютер может записывать только числа, а если быть точным, только нули и единицы, в которых кодируются другие цифры, буквы, изображения. Как в цифрах записать такие сложные данные как звук?

Решение довольно простое - нарезать звуковую волну маленькими кусочками, то есть преобразовать непрерывную функцию (звуковую волну) в дискретную. Этот процесс называется дискретизацией , не от слова «кретин», а от слова «дискретность» (лат. discretus - разделённый, прерывистый). Каждый такой маленький кусочек звуковой волны уже очень легко описать цифрами (уровень сигнала в определенный момент времени), что при цифровой записи и происходит. Этот процесс называется аналого-цифровым преобразованием (analog to digital conversion), а преобразующее устройство (микросхема), соответственно, - аналого-цифровым преобразователем (analog to digital convertor) или АЦП (ADC).

Вот пример отрывка звуковой волны длиной почти в пять миллисекунд райд-тарелки (ride cymbal):

Видите, она вся состоит из зубчиков? Это и есть дискретные маленькие кусочки, на которые нарезана звуковая волна, но при желании через эти зубчики-столбики можно провести непрерывную кривую линию, которая и будет изначальной звуковой волной. При воспроизведении так и происходит в устройстве (тоже микросхеме) под названием цифро-аналоговый преобразователь (digital to analog convertor) или ЦАП (DAC). АЦП и ЦАП являются основными деталями аудио-интерфейса и от их качества зависит его качество и возможности.

Частота дискретизации и битность

Я, наверное, уже утомил даже самых стойких читателей, но не отчаивайтесь, это часть статьи, ради которой она и затевалась.

У процесса преобразования аналогового сигнала в цифровой (и наоборот) есть два важных свойства - это частота дискретизации (она же частота семплирования или sample rate) и глубина дискретизации (битность).

Частота дискретизации - это частота, с которой звуковой сигнал режется на кусочки (семплы). Не повторите мою ошибку: с частотой звука частота дискретизации связана только через теорему Котельникова, которая говорит: для того, чтобы однозначно восстановить исходный сигнал, частота дискретизации должна более чем в два раза превышать наибольшую частоту в спектре сигнала. Таким образом используемая при записи CD и музыки частота дискретизации в 44,1 кГц покрывает
слышимый человеком диапазон частот.

Битность - это глубина дискретизации, измеряемая в битах, то есть это количество бит, используемое для записи амплитуды сигнала. При записи CD используется 16 бит, что достаточно для в 96 дБ, то есть мы сможем записать звук, у корого разница между самой тихой и самой громкой его частями составляет 96 дБ, что почти всегда достаточно для записи любой музыки. В студиях при записи обычно применяют 24-битную разрядность, что даёт динамический диапазон в 144 дБ, но поскольку 99% устройств, воспроизводящих звук (магнитофоны, плееры, звуковые карты, идущие в комлекте с компьютером) умеют обрабатывать только 16-разрядный звук, при рендеринге всё равно придётся потерять 48 дБ (144 минус 96) динамического диапазона, используя 16-битное разрешение.

Напоследок подсчитаем битрейт музыки на Audio CD:
16 бит x 44 100 семплов в секунду x 2 канала = 1 411 200 бит в секунду = 1 411,2 кбит/с.

Таким образом, одна секунда записи на Audio CD занимает 172 килобайта или 0,168 мегабайта.

Это всё, что я хотел рассказать про запись звука на компьютере.
Ну, или почти всё.

Последний раздел для хардкорных читатателей.

Dither

При рендеринге проектов в звуковых редакторах при выборе формата 44 100 kHz 16 bit иногда появляется галочка Dither. Что это такое?
Это подмешивание псевдослучайного сигнала. Едва ли вам стало легче от такой формулировки, но я сейчас объясню.

При аналого-цифровом преобразовании происходит округление амплитуды. То есть при 16-битной глубине дискретизации нам доступно 2 16 = 65 536 возможных вариантов уровня амплитуды. Но если амплитуда у звука в одном из семплов оказалась равной 34 целых и 478 тысячных, то нам придётся её округлить до 34.

Для малых уровней амплитуды входного сигнала такое округление несёт негативные последствия в виде искажений, с чем и борется dither .

Вот теперь точно всё. Спасибо за чтение!

Не забудьте написать комментарий и нажать на красивые кнопочки социальных сетей в низу статьи.

Сегодня мы затронем такую интересную тему, как цифровая запись звука (англ. digital sound recording). Так называется фиксация звуковых колебаний в формат чисел для последующего их воспроизведения и обработки.

На студии ТопЗвук запись производится на высококачественную цифровую систему записи MOTU 828km3 с высококачественными аналогово-цифровыми преобразователями, позволяющую фиксировать звук с частотой дискретизации до 192 кГц и глубиной квантования 32 бит, что дает кристально чистое и воздушное звучание.ТопЗвук

Во время оцифровки сигнал преобразуется в ряд числовых значений звукового колебания. В отличие от аналогового звука (который непрерывен) , цифровой звук состоит из множества фрагментов-сэмплов, проще говоря «кирпичиков», составляющих записанный фрагмент. Количество записанных в 1 секунду сэмплов называется частотой сэмплирования или частотой дискретизации, и чем это значение выше, тем более качественно будет оцифровываться сигнал.

Цены на услуги звукозаписи

Услуга Способ оплаты Стоимость
Запись голоса Почасовая 750 руб/час
Запись инструментов Почасовая 750 руб/час
Создание барабанных партий Почасовая 750 руб/час
Сведение и мастеринг Почасовая 750 руб
RAP под минус Фиксированная 3000 руб
RAP под минус "Премиум" (с доп. эффектами) Фиксированная 4000 руб
Песня под минус "Лайт" (1 ч. записи + обработка без тюнинга) Фиксированная 2500 руб
Песня под минус "Премиум" (1 ч. записи + обработка и глубокий тюнинг) Фиксированная 5000 руб
Создание аранжировки Фиксированная от 15.000 руб
Создание минусовки Фиксированная От 15.000 руб.
Аренда студии без звукорежиссера Почасовая 700 руб/час

Стандарты современной цифровой записи – частота сэмплирования от 44100 до 192000 Гц. Помимо частоты дискретизации, отвечающей за запись звука во временном измерении, есть еще один важный параметр, называющийся глубиной квантования, отвечающий за динамику (минимальную и максимальную громкость) записываемого звука и измеряющийся в битах.

Стандарты битности в звукозаписи от 16 до 32 бит. Цифровая запись звука позволяет получить очень достоверное и детальное звучание .

Примеры портфолио под минус (РОК, ПОП, РЭП)

TZ

Пример 1. РОК
Группа «THE Y» - песня «RUN FOR LIFE»

TZ

Пример 2. РОК
Группа «Пылаем» - Песня «Сочи»

TZ

Пример 3. ПОП
Песня «Больше чем любовь» под минус + сведение

TZ

Пример 4. ПОП
Песня «Плакала» под минус + сведение

TZ

Пример 5. РЭП
Песня «Дай мне» под минус + сведение

TZ

Пример 6. РЭП
Песня «Пропаганда правды» под минус + сведение

Что же такое звук

Звук представляет собой регулярные колебания какой-либо среды, которые распространяются в виде волн. Когда мы слышим какой-то звук, как правило, он распространяется в воздухе. Но звук может распространятся также и в водной среде, и через твердые тела (например, стены домов). При этом скорость распространения звуковых волн может несколько отличаться в различных средах. Чем больше амплитуда волны, тем более громким слышится звук. На иллюстрации ниже видна эта зависимость.

Другое важное свойство звуковых колебаний — это их частота. На иллюстрации ниже видно, как изменяется высота звука в зависимости от частоты колебаний волн.

На приведенных примерах — простая синусоидальная форма звуковой волны. Но на самом деле в жизни нас окружают гораздо более сложные звуки, образуемые множеством таких колебаний и их сочетанием. И подобные сложные сочетания — как раз то, что отличает голос одного человека от другого, или звучание разных музыкальных инструментов.

Отличительные черты аналоговой записи

Аналоговая звукозапись (чаще всего это запись на магнитную ленту) тоже имеет место быть в современном мире, и некоторые артисты предпочитают записываться на пленку для получения особенного, винтажного звучания. Но этот способ куда более требователен к качеству исполнения. Но нельзя сказать, что аналоговая звукозапись является точной. Она скорее вносит свои, свойственные только ей краски, особенную теплоту и красоту в звук, но нельзя сказать, что достоверный и реалистичный звук. Также, в отличие от аналоговой, цифровая запись звука не подвержена старению и выдерживает любое количество копий без ухудшения качества звучания.

На студии ТопЗвук запись производится на высококачественную цифровую систему записи MOTU 828km3 с высококачественными аналогово-цифровыми преобразователями, позволяющую фиксировать звук с частотой дискретизации до 192 кГц и глубиной квантования 32 бит что дает кристально чистое и воздушное звучание, такое же, каким вы слышите его вживую. Высокое качество записываемого исходника позволяет при обработке дорожек эффектами на этапе сведения добиваться куда более качественного звучания. Это очень важно, т.к. использование любого другого студийного оборудования не имеет большого смысла в случае некачественного аналого-цифрового преобразования. В этом случае можно получить звук в виде, очень далеком от оригинала .

Специалисты нашей студии запишут вашу песню, сделают компьютерную аранжировку или оцифруют любой аналоговый аудиоматериал в высоком цифровом качестве – пластинки, пленки, кассеты. Звоните, и мы найдем общий язык.

Цифровая запись звука против аналоговой

Напоследок порассуждаем о том, так ли уж сильно отличается запись цифровая от аналоговой. На самом деле противопоставление цифровой и аналоговой записи звука – вещь достаточно условная. Об этом, конечно же, знают узкоспециализированные специалисты, но у простых людей сложилось не совсем точное понимания того, что представляет собой так называемая аналоговая звукозапись.

Прежде всего, напомним, что в недавнее время, когда запись звука цифровым методом не была развита по причине недостаточного развития вычислительной техники, для записи звука применялись магнитофоны. Которые принято называть аналоговыми. Но само понятие аналоговой записи предполагает непрерывность в противовес дискретности, которой, как известно, и отличается цифровая запись , и которая считается источником потенциальных проблем при использовании записи звуковых сигналов цифровым методом. Так вот, традиционный магнитофон, как бытовой, так и студийный (даже многодорожечный) вовсе не обеспечивает непрерывной записи звукового сигнала на магнитной ленте. Это знает каждый, кто интересовался устройством магнитной головки и принципом такой записи.

Звуковой сигнал на ленте состоит из отдельных фрагментов, размер которых, к слову, определяется шириной зазора записывающей (или универсальной) магнитной головки магнитофона. То есть магнитная запись дискретна, она не может быть непрерывной. Что касается еще одного распространенного носителя прошлого, популярного ныне в некоторых кругах – винилового дика – то и в этом случае не идет речь о 100% аналоговом звуке, поскольку мастер-записи для виниловых дисков сейчас делаются при помощи компьютеров, а ранее делались… Да, да — при помощи магнитофонов! Так что единственный настоящий аналоговый звукозаписывающий механизм – это фонограф Эдисона!

Если вам нужна действительно качественная цифровая запись звука , обращайтесь в ТопЗвук. Мы работаем без выходных и ждем вашего звонка прямо сейчас!

Традиционное аналоговое представление сигналов основано на подобии (аналогичности) электрических сигналов (изменений тока и напряжения) представленным ими исходным сигналам (звуковому давлению, температуре, скорости и т.п.), а также подобии форм электрических сигналов в различных точках усилительного или передающего тракта. Форма электрической кривой, описывающей (переносящей) исходный сигнал, максимально приближена к форме кривой этого сигнала.

Такое представление наиболее точно, однако малейшее искажение формы несущего электрического сигнала неизбежно повлечет за собой такое же искажение формы и сигнала переносимого. В терминах теории информации, количество информации в несущем сигнале в точности равно количеству информации в сигнале исходном, и электрическое представление не содержит избыточности, которая могла бы защитить переносимый сигнал от искажений при хранении, передаче и усилении.

Любой природный звук имеет аналоговую природу: кожа барабана, струны рояля, голосовые связки плавно перемещаются в пространстве, вызывая упругие волны (области сжатия/разрежения воздуха), которые распространяются в атмосфере. Звуком называются механические волны, частоты которых лежат в пределах от 17-20 до 20000 Гц. Механические волны таких частот производят ощущение звука. Механические волны с частотами ниже 17 Гц называют инфразвуками ,

а свыше 20000 Гц - ультаразвуками . Звуковые волны, улавливаемые ушной раковиной, вызывают вибрацию барабанной перепонки (рис.7.1) и затем через систему слуховых косточек, жидкостей и др. образований передаются воспринимающим рецепторным клеткам, вызывающим в мозгу челеовека звуковые ощущения. При этом громкость звука определяется силой, с которой звуковые волны воздействуют на ухо человека (амплитудой звуковой волны), а высота тона определяется частотой колебаний. Сила ощущения звуковых волн органами слуха субъективна, зависит от чувствительности органа слуха, но непосредственно связана с интенсивностью волн. При определенной минимальной интенсивности человеческое ухо не воспринимает звука. Эта минимальная интенсивность называется порогом слышимости . Порог слышимости имеет различные значения для звука различных частот. При больших интенсивностях ухо испытывает болевое ощущение. Наименьшая интенсивность при болевом восприятии звука называется порогом болевого ощущения .



Уровень интенсивности звука определяется в децибелах (дБ). Количество децибел равно десятичному логарифму отношения интенсивностей, умноженному на 10, т.е. 10lg(I/I 0).

Для преобразования звуковых колебаний в электрические в телефонных аппаратах, устройствах звукозаписи, системах радиовещания и др. областях используются микрофоны. При этом на выходе микрофонов образуется непрерывно изменяющееся аналоговое напряжение (аналог давления и частоты колебаний звуковой волны).

Однако компьютер оперирует нулями и единицами. Процесс оцифровки звука заключается в мгновенной регистрации величины напряжения в различные моменты времени и последующем "склеивании" полученных значений. При просмотре фильма, глаза и мозг связывают цепочку неподвижных изображений в непрерывное движение. В случае цифрового звука "кадры" сливаются в проигрывающем устройстве: непрерывно изменяющееся напряжение более или менее точно воссоздается и подается на громкоговоритель. Если все сделано правильно, то динамик воспроизводит оригинальное движение струны рояля или кожи барабана. Аналогия с фильмом верна в принципе, однако, аудио-"кадры" (samples) записываются в сотни и тысячи раз чаще, чем кадры фильма.

Возможно, аудио-"кадры" нагляднее сравнивать с точками, из которых состоит газетная фотография. Чем плотнее расположены точки (чем выше линиатура), тем более детально воспроизводится изображение. Высокая линиатура требует более качественной бумаги и более аккуратной печати, а большая частота сэмплирования приводит к сильной загрузке компьютера: за один и тот же промежуток времени обрабатывается больше значений, а для хранения и передачи данных требуется большая память и полоса пропускания. В обоих случаях приходится искать компромисс между практичностью и точностью воспроизведения.

При аналоговом способе записи сохраняются величины, непрерывно изменяющиеся по амплитуде и во времени, то есть изменение параметров может происходить на любую бесконечно малую величину. Для сигналов, изменяющихся во времени, важную роль играет частота измерений. Рассмотрим это утверждение на примере цифровой звукозаписи. Оцифрованный звук представляет собой существенную часть мультимедиа. Поэтому представляется рациональным принципиально разобраться в оцифровке звуковой информации.

Как и при оцифровке изображения, для цифровой звукозаписи требуется наличие технического аналога органа чувств. Только здесь это не «электронный глаз», а «электронное ухо», в качестве которого обычно используют микрофон. В микрофоне имеется мембрана, в которой под воздействием звуковой волны возбуждаются колебания, и с помощью катушки на магнитном сердечнике звуковая информация преобразуется в численные значения. Таким образом, мы должны иметь дело с изменяющимся во времени сигналом, а именно, с электрическим напряжением, величина которого изменяется с течением времени.

При цифровом способе записи сохраняются величины, измеренные через определенные последовательные промежутки времени и принимающие фиксированные значения.

Звуковые колебания преобразуются в аудиоадаптере в цифровой сигнал, записываются на каком-либо носителе информации, например, на магнито-оптическом компакт-диске, а затем, если потребуется, через аудиоадаптер преобразуются обратно в аналоговый сигнал и воспроизводятся через громкоговоритель. На рис.7.2 повышение и спад звукового давления представлены в виде кривой.

Обычно уже в аналоговом представлении имеется ошибка, появляющаяся из-за несовершенства преобразований. Так как при обработке, передаче и записи возникают искажения и помехи, то при воспроизведении сигнала нет точного совпадения с оригиналом. Сигнал ухудшается при каждой последующей обработке. Чем чаще повторять этот процесс, тем хуже и хуже будут результаты. Как правило, потеря качества отчетливо ощущается уже после первой обработки. Потеря качества с каждой новой копией может зайти так далеко, что на копии Х вообще нельзя будет ничего различить. Для того чтобы при обработке уменьшить эти ошибки, приходится применять дорогое и сложное оборудование.

Вернемся к примеру со звуковыми волнами. Чтобы характеристики звука (например, его высоту) описать более точно, нужны определенные физические понятия. Первоначально звук существует как аналоговый сигнал (воспринимаемый микрофоном), причем в виде чередования возрастания и спада звукового давления на мембрану микрофона, что вызывает в ней колебательный процесс.

Первая гармоника колебаний мембраны может быть представлена в виде синусоиды. Максимальное отклонение от положения покоя (как вверх, так и вниз) называется амплитудой.

Число колебаний в течение одной секунды называется частотой и измеряется в герцах (Гц). Одно колебание совершается в течение промежутка времени, называемого периодом колебаний, за который процесс, начиная от положения покоя, побывает в верхней и нижней максимальных точках и снова вернется в положение покоя (рис.7.3).

Если представить звуковые волны в виде колебаний на осциллографе, то можно заметить, что большей громкости звука соответствует большая амплитуда колебаний. Точно также и частота колебания зависит от того, низкий звук или высокий (рис.7.4).

Если рассмотреть на осциллографе реакцию микрофона на речь или музыку, то мы увидим не регулярную синусоиду, а более сложную кривую, которая возникает как результат наложения и взаимодействия разных колебаний; это наложение также называют интерференцией.

Цифровое представление выглядит совершенно иначе. При цифровом представлении изменение величины происходит дискретно и как бы заморожено в некоторые моменты времени для измерения значений. Таким образом, эти значения описывают процесс, определяя его состояние в определенные моменты времени последовательностью дискретных чисел. Аналоговый сигнал преобразовывается в цифровой (дискретизируется) при помощи аналого-цифрового преобразователя (АЦП). В нем аналоговый сигнал после измерения на входе квантуется и кодируется. Чем короче временные промежутки между отдельными измерениями, тем точнее описывается и затем воспроизводится процесс. Частота, с которой дискретизируется аналоговый сигнал, называется частотой дискретизации. Преимущество этого способа представления очевидно: так как измеренная величина существует в форме числа, то копирование происходит без потери качества, так как переписывается лишь число. Не наблюдается потеря качества и для копии X, если, разумеется, копирование происходит без ошибок.

Теперь давайте выясним, как часто в единицу времени требуется измерять величину напряжения, поступающего от микрофона, чтобы получить наилучшее качество оцифровки. В качестве важнейшего граничного условия здесь выступает чувствительность человеческого уха к звуковым волнам различной длины

В молодом возрасте порог чувствительности находиться на частоте около 20000 герц, а со временем существенно снижается, и человек не способен их воспринимать звуковые волны с частотами выше 20000 герц. При этом происходило бы только бесполезное увеличение объема данных. Из критерия Найквиста следует, что для оцифровки без искажений замеры следует производить с шагом вдвое меньше, чем самая тонкая деталь информации. При звукозаписи самой тонкой деталью является колебание с частотой 20000 герц, поэтому замеры напряжения должны производиться не реже 40000 раз в секунду. Фактически берут несколько большее значение и производят замеры с частотой 44100 герц.

Это некруглое значение обусловлено тем, что для осуществления первых цифровых записей применялся видеомагнитофон. Такой магнитофон, работающий по стандарту цветного телевидения PAL, записывает 50 изображений (полей) в секунду, и в каждом поле записывается по 294 телевизионных строки, причем это значение стандартизовано. В противоположность этому, число замеров звукового сигнала на строку может изменяться и до определенной верхней границы может быть любым целым числом. При трех замерах на строку в секунду получается 50 х 294 х 3 замеров, что и составляет точно 44100. Интересно, что видеомагнитофон, работающий по американскому стандарту NTSC, также пригоден для такой звукозаписи, поскольку в нем записывается 60 полей в секунду по 245 строк (60 х 245 х 3 также дает 44100).

Однако звуковой сигнал, получаемый, например, от музыкального инструмента, вполне может содержать обертоны с частотой 22000 герц. Это вызывает определенные трудности. Так же как при сканировании изображений со слишком низким разрешением, недостаточное разрешение при оцифровке в случае звукозаписи может привести к искажениям. Из-за низкого числа замеров в оцифрованном сигнале возникают новые колебания, которых не было в исходном сигнале. Этот эффект называют помехой дискретизации, а саму помеху - ложными частотами (по-английски используется термин aliasing). На начальном этапе цифровой звукотехники ложные частоты создавали значительные трудности для инженеров. Между тем появились фильтры с очень резким срезом, которые устраняют в звуковом сигнале частоты выше допустимого значения около 22000 герц, перед тем как сигнал будет подан на аналого-цифровой преобразователь. В этой связи говорят, что перед оцифровкой сигнал ограничивается по полосе частот.

Остается еще проблема точности измерений. Хотя при заниженной точности ложные частоты и возникают, качество записи явно ухудшается. АЦП сравнивает измеренную величину со шкалой числовых значений и присваивает этой величине дискретное значение из имеющихся на шкале. Присвоенное дискретное значение настолько точно отражает состояние процесса, насколько малы по величине деления на шкале.

Если, например, имеется довольно грубая шкала от 1 до 16 (всего 16 значений), то неизбежно возникает относительно большое отклонение значения дискретизируемой величины от квантованного присвоенного значения. Это отклонение называется ошибкой квантования или искажением квантования. Если же шкала имеет 256 значений, то, следовательно, ошибка квантования уменьшается в четыре раза. Так как для записи используется лишь двоичное представление числа, то это означает, что 16 (2 4) степеней сравнения требуют для описания четыре бита. Следовательно, для 256 (2 8) потребуется 8 бит. При допустимой ошибке менее 0,1 процента необходимо иметь 1000 степеней сравнения, для чего потребуется 10 бит.

Цифровая запись музыки в стереофоническом режиме, используемая, например, на компакт-дисках, выполняется с частотой отсчетов 44,1 килогерц и точностью измерений 16 бит (2 байта). Это соответствует объему данных 44100 х 2 х 2 = 176400 байт в секунду, что весьма немало. В мультимедиа-приложениях такой поток данных приемлем только в определенных условиях. Обычно качество записи для этих целей снижают, используя частоту отсчетов 22 килогерц и разрешение 8 бит, причем ограничиваются монофоническим воспроизведением. Благодаря этому поток данных снижается до 22 Кбайт в секунду. Однако дальнейшее снижение уже недопустимо, поскольку оно привело бы к слишком сильному снижению качества звука.

Высококачественный (Hi-Fi) проигрыватель компакт-дисков имеет разрядность 16 бит; это позволяет различать при сравнении 65536 различных состояний. Аудиоадаптер может иметь разрядность 8 бит и 256 различных состояний. Так как при записи приходится обрабатывать огромные объемы данных, то, чтобы не загружать микропроцессор, используется так называемый метод DMA(Direct Memory Access - прямой доступ к памяти). Данные, минуя микропроцессор, прямо попадают в память Чтобы устранить конфликт между аудиоадаптером и микропроцессором, в компьютере имеется специальная микросхема которая называется контроллер прямого доступа к оперативной памяти Контроллер управляет доступом к памяти со стороны микропроцессора или других адаптеров через каналы прямого доступа (номер такого канала требуется задать при инсталляции аудиоадаптера).

Преобразование цифровой величины в аналоговый сигнал который может слышать ухо, происходит в цифро-аналоговом преобразователе (ЦАП - Digital-to-Analog Converter - DAC).

Подводя итог, можно сказать, что цифровая аудиозапись (digital audio) - это цифровое представление аналогового звукового сигнала. Для формирования цифрового представления звукового сигнала используется процесс выборки (sampling). Данный процесс заключается в периодическом измерении амплитуды (громкости) аналогового звукового сигнала и преобразовании полученного значения в последовательность битов. Для осуществления такого преобразования используется специальное устройство, которое называется аналого-цифровой преобразователь - АЦП (Analog-to-Digital Converter - ADC). На выходе АЦП формируется последовательность байтов, которая может быть записана либо на магнитную ленту, либо на другое цифровое устройство в двоичной форме.

Запись в двоичной форме позволяет избежать появления помех во время записи на магнитный носитель, так как записываются только два уровня сигнала - логический ноль и логическая единица, в отличие от аналогового способа записи, при котором записывается много различных уровней сигнала.

Такие системы записи звука обычно называют системами цифровой аудиозаписи с импульсно-кодовой модуляцией (Pulse Code Modulation - PCM). Однако в компьютерной терминологии такой процесс принято называть волновой аудиозаписью (waveaudio или waveform audio).

Цифровой звук характеризуется следующими параметрами:

частотой дискретизации (sampling rate), которая определяет, сколько раз оцифровывается звуковой сигнал за единицу времени и измеряется в килогерцах (килогерц - тысяча выборок в секунду). Данная характеристика показывает, как часто измеряется значение амплитуды входного звукового сигнала в момент записи звука, а тем самым - насколько правильно цифровое представление звука отражает скорость изменения амплитуды звукового сигнала (рис.7.6).

звуковым разрешением (audio resolution), характеризующим правильность представления амплитуды исходного аналогового сигнала. Обычно цифровые аудиосистемы бывают 8- и 16-разрядными.

Наиболее часто используют частоты дискретизации 11,025; 22,05 и 44,1 кГц. При частоте 11,025 кГц достаточно хорошо воспроизводится человеческая речь. При частоте 22,05 кГц неплохо звучит не только человеческая речь, но и музыкальные фрагменты. А для очень хорошего представления музыкального звучания необходимо использовать частоту дискретизации не менее 44,1 кГц.

Частота дискретизации сильно влияет на количество информации, необходимое для хранения звука. Так, например, воспроизведение 16-разрядного стереозвука с частотой дискретизации 44,1 кГц требует хранить для одной секунды звучания 176,2 Кбайт, а для воспроизведения секунды такого же звука с частотой дискретизации 22,05 кГц требуется 90 К байт, что почти в два раза меньше.

8-разрядные системы осуществляют преобразование амплитуды аналогового сигнала только в 256 фиксированных значений (рис.7.8). Такое представление аналогового сигнала не является очень точным, а, следовательно, выходной сигнал, восстановленный по 8-разрядному представлению, будет отличаться от оригинального звукового сигнала. Такое отличие обычно хорошо заметно на слух.

16-разрядные системы осуществляют преобразование амплитуды аналогового сигнала уже в 65536 фиксированных значений. В таких системах качество оцифрованного звука намного лучше и практически не отличается от оригинального звучания. Кроме того обеспечивается широкий динамический диапазон (выраженная в децибелах разность между самым сильным сигналом, который устройство в состоянии пропустить, и самым слабым, еще различимым на фоне остаточных шумов). Благодаря этому современные цифровые системы воспроизведения звука, такие как цифровые аудио компакт-диски и цифровые аудиомагнитофоны, обычно используют 16-разрядные системы (рис.7.9).

Аудиофайлы, как и графические данные, можно уплотнять. Это позволяет значительно сократить объем передаваемой информации. Для этого используются кодеки (рис.7.10).

Звукоза́пись - процесс записи звуковых сигналов. Результатом звукозаписи является фонограмма .

Необходимое оборудование: устройство для преобразования акустических колебаний в электрический сигнал (микрофон) или генератор тона (напр. звуковой синтезатор , семплер), устройство для преобразования электрических колебаний в последовательность цифр (в цифровой записи), устройство для сохранения (магнитофон, жёсткий диск компьютера или иное устройство для сохранения полученной информации на носитель). Звукозапись может быть моно-, стерео- и квадрофонической.

Самая старая из известных звукозаписей была сделана 9 апреля 1860 года парижским изобретателем Эдуардом-Леоном Скоттом де Мартенвилем с помощью устройства, называемого «фоноавтограф » .

В зависимости от сохранения, выделяют два основных вида записи звуков: аналоговый и цифровой .

Аналоговая звукозапись [ | ]

Магнитная звукозапись [ | ]

Запись производится с помощью записывающей магнитной головки, создающей переменное магнитное поле на участке движущегося носителя (зачастую магнитной ленты), обладающего магнитными свойствами. На ферромагнитном слое носителя остаётся след остаточного намагничивания. След и есть дорожка фонограммы. При воспроизведении магнитная головка преобразует остаточный магнитный поток движущегося носителя записи в электрический сигнал звуковой частоты.

Цифровая звукозапись [ | ]

Под цифровой записью понимают оцифровку и сохранение звука в виде набора бит (битовой последовательности), который описывает воспроизведение тем или иным устройством.

Магнитная цифровая звукозапись [ | ]

Запись цифровых сигналов производится на магнитную ленту. Выделяют два типа записи:

Магнитооптическая запись [ | ]

Запись на магнитооптический диск осуществляется по следующей технологии: излучение лазера разогревает участок дорожки выше температуры точки Кюри , после чего электромагнитный импульс изменяет намагниченность, создавая отпечатки, эквивалентные питам на оптических дисках. Считывание осуществляется тем же самым лазером, но на меньшей мощности, недостаточной для разогрева диска: поляризованный лазерный луч проходит сквозь материал диска, отражается от подложки, проходит сквозь оптическую систему и попадает на датчик. При этом в зависимости от намагниченности изменяется плоскость поляризации луча лазера (эффект Керра), что и определяется датчиком.

Лазерная запись [ | ]

При записи данные записываются на диск лучом лазера повышенной мощности, чтобы физически «прожечь» органический краситель записывающего слоя. Когда краситель нагревается выше определённой температуры, он разрушается и темнеет, изменяя отражательную способность «прожжённой» зоны. Таким образом при записи, управляя мощностью лазера, на записывающем слое получают чередование тёмных и светлых пятен, которые при чтении интерпретируются как питы. При чтении лазер имеет значительно меньшую мощность, чем при записи, и не разрушает краситель записывающего слоя. Отражённый от отражающего слоя луч попадает на фотодиод, а если луч попадает на тёмный - «прожжённый» - участок, то луч почти не проходит через него до отражающего слоя и фотодиод регистрирует ослабление светового потока. Чередующиеся светлые и тёмные участки дорожки порождают изменение светового потока отражённого луча и переводятся в изменение электрического сигнала, который далее и преобразуется в биты информации электрической системой привода - «декодируется».

Оптическая цифровая запись звука [ | ]

Звуковое сопровождение к фильму печатается непосредственно на 35-мм киноплёнку оптическим методом в цифровом закодированном виде. При воспроизведении цифровой сигнал считывается специальной насадкой на кинопроектор и затем декодируется процессором в многоканальную фонограмму.

Цифровые аудиоформаты [ | ]

Запись звуковых данных производится в файл определённого формата , который сохраняется на электронных звуковых носителях.

Под аналоговой подразумевают запись звуков на физический носитель таким образом, чтобы устройство воспроизведения производило колебания и создавало звуковые волны аналогичные тем, что были получены при сохранении.

Механическая звукозапись

Записываемый звук воздействовал через рупор на мембрану, жёстко связанную с резцом. При воспроизведении игла, двигающаяся по канавке, передаёт колебания на упругую мембрану, которая излучает звук. Звук усиливался при помощи рупора конической формы.

· Фоноавтограф (1857)

· Фонограф (1878)

· Граммофон (1887)

· Патефон (1907)

Электромеханическая запись

Записываемые звуковые колебания преобразуются микрофоном в соответствующие электрические токи, воздействующие после их усиления на электромеханический преобразователь - рекордер, который превращает переменные электрические токи посредством магнитного поля в соответствующие механические колебания резца. Для воспроизведения применялся пьезоэлектрический, а позднее более качественный - магнитный звукосниматель. Звукосниматели преобразуют колебания иглы, бегущей по звуковой дорожке грампластинки, в электрический сигнал, который после усиления в электронном усилителе поступает в громкоговоритель.

· Электрофон (1925)

Оптическая (фотографическая) запись звука

Фотографическая фонограмма имела переменную ширину дорожки (1904) или переменную оптическую плотность (1919) и наносилась на кромку киноленты. При воспроизведении световой поток лампы проходя сквозь киноленту изменялся (модулировался) в соответствии с записанными звуковыми колебаниями. Фотоэлемент превращал падающий на него переменный световой поток в электрические колебания. Электрический сигнал усиливался усилителем воспроизведения и поступал на громкоговоритель, установленный у экрана в зрительном зале кинотеатра.

Магнитная звукозапись

Запись производится с помощью записывающей магнитной головки, создающей переменное магнитное поле на участке движущегося носителя (зачастую магнитной ленты), обладающего магнитными свойствами. На ферромагнитном слое носителя остается след остаточного намагничивания. След и есть дорожка фонограммы. При воспроизведении магнитная головка преобразует остаточный магнитный поток движущегося носителя записи в электрический сигнал звуковой частоты.

· Магнитофон (1932)

  1. Цифровая звукозапись

Под цифровой записью понимают оцифровку и сохранение звука в виде набора бит (битовой последовательности), который описывает воспроизведение тем или иным устройством.

Магнитная цифровая звукозапись

Запись цифровых сигналов производится на магнитную ленту. Выделяют два типа записи:


· продольно-строчная система записи - в которой лента движется вдоль блока неподвижных магнитных головок записи/воспроизведения

o DASH (1982) (англ. Digital Audio Stationary Head)

o DCC (1992) (англ. Digital compact cassette, цифровая компакт-кассета)

· наклонно-строчная система записи - в которой лента движется вдоль барабана вращающихся магнитных головок и запись осуществляется наклонно отдельными дорожками, что обеспечивает большую плотность, по сравнению с продольно-строчной системой записи.

o DAT (1987) (англ. Digital audio tape)

Магнитооптическая запись

Запись на магнитооптический диск осуществляется по следующей технологии: излучение лазера разогревает участок дорожки выше температуры точки Кюри, после чего электромагнитный импульс изменяет намагниченность, создавая отпечатки, эквивалентные питам на оптических дисках. Считывание осуществляется тем же самым лазером, но на меньшей мощности, недостаточной для разогрева диска: поляризованный лазерный луч проходит сквозь материал диска, отражается от подложки, проходит сквозь оптическую систему и попадает на датчик. При этом в зависимости от намагниченности изменяется плоскость поляризации луча лазера (эффект Керра), что и определяется датчиком.

· Минидиск (MD) (1992)

Лазерная запись

При записи данные записываются на диск лучом лазера повышенной мощности, чтобы физически «прожечь» органический краситель записывающего слоя. Когда краситель нагревается выше определённой температуры, он разрушается и темнеет, изменяя отражательную способность «прожжённой» зоны. Таким образом при записи, управляя мощностью лазера, на записывающем слое получают чередование тёмных и светлых пятен, которые при чтении интерпретируются как питы. При чтении лазер имеет значительно меньшую мощность, чем при записи, и не разрушает краситель записывающего слоя. Отражённый от отражающего слоя луч попадает на фотодиод, а если луч попадает на тёмный - «прожжённый» - участок, то луч почти не проходит через него до отражающего слоя и фотодиод регистрирует ослабление светового потока. Чередующиеся светлые и тёмные участки дорожки порождают изменение светового потока отражённого луча и переводятся в изменение электрического сигнала, который далее и преобразуется в биты информации электрической системой привода - «декодируется».

· Звуковой компакт-диск (1982) (CD)

· DTS (1993) - фонограмма к фильмокопии на отдельном компакт-диске

· DVD-Audio (1999) (DVD-A)

· SACD (1998) (Super audio compact disc, супер аудио компакт-диск)

Оптическая цифровая запись звука

Звуковое сопровождение к фильму печатается непосредственно на 35-мм киноплёнку оптическим методом в цифровом закодированном виде. При воспроизведении цифровой сигнал считывается специальной насадкой на кинопроектор и затем декодируется процессором в многоканальную фонограмму.

· Dolby Digital (1992)

Запись звуковых данных производится в файл определенного формата, который сохраняется на электронных звуковых носителях.

· Нотные: MIDI (1982)

· Оцифрованный звук: OGG, MP3, WAV и т.п.

Вопросы для самоконтроля

1. Опишите технологию выполнения работ с лазерными или оптическими дисками

2. На какие виды делится компьютерная графика?

3. Опишите наиболее распространенные Звуковые технические средства.