среда, декабря 3

Заработок в интернет

Как заработать на собственном блоге? Да очень просто! Теперь это возможно с новым сервисом блогун - заработок на блогах. Для того, чтобы заработать деньги достаточно просто исправно писать в своем блоге и ставить ссылки, вот и всё!
Регистрируйтесь и начинайте зарабатывать!

четверг, августа 28

Громкость звука

Гро́мкость зву́ка — субъективное восприятие силы звука (абсолютная величина слухового ощущения). Громкость главным образом зависит от звукового давления и частоты звуковых колебаний. Также на громкость звука влияют его тембр, длительность воздействия звуковых колебаний и другие факторы.

Единицей абсолютной шкалы громкости является сон. Громкость в 1 сон — это громкость непрерывного чистого синусоидального тона частотой 1 кГц, создающего звуковое давление 2 мПа.

Уровень громкости звука — относительная величина. Она измеряется в фонах и численно равна уровню звукового давления (в децибелах — дБ), создаваемого синусоидальным тоном частотой 1 кГц такой же громкости, как и измеряемый звук (равногромким данному звуку).
Зависимость уровня громкости от звукового давления и частоты

Зависимость уровня громкости от звукового давления и частоты

На рисунке выше изображено семейство кривых равной громкости, называемых также изофонами. Они представляют собой графики стандартизированных (международный стандарт ISO 226) зависимостей уровня звукового давления от частоты при заданном уровне громкости. С помощью этой диаграммы можно определить уровень громкости чистого тона какой-либо частоты, зная уровень создаваемого им звукового давления.

Например, если синусоидальная волна частотой 100 Гц создаёт звуковое давление уровнем 60 дБ, то, проведя прямые, соответствующие этим значениям на диаграмме, находим на их пересечении изофону, соответствующую уровню громкости 50 фон, — значит, данный звук имеет уровень громкости 50 фон.

Изофона "0 фон", обозначенная пунктиром, характеризует порог слышимости звуков разной частоты для нормального слуха.

вторник, февраля 26

Что такое звук?

Звук, в широком смысле — упругие волны, распространяющиеся в среде и создающие в ней механические колебания; в узком смысле — субъективное восприятие этих колебаний специальным органом чувств человека и других животных.

Как и любая волна, звук характеризуется амплитудой и частотой. Считается, что человек слышит звуки в диапазоне частот от 16 Гц до 20 000 Гц. Звук ниже диапазона слышимости человека называют инфразвуком, выше, до 1 МГц — ультразвуком, от 1 МГц до 10 МГц — гиперзвуком. Среди слышимых звуков следует также особо выделить фонетические, речевые звуки и фонемы, из которых состоит устная речь, и музыкальные звуки, из которых состоит музыка.

Понятие о звуке

Звуковые волны могут служить примером колебательного процесса. Всякое колебание связано с нарушением равновесного состояния системы и выражается в отклонении её характеристик от равновесных значений. Для звуковых колебаний такой характеристикой является давление в точке среды, а её отклонение — звуковым давлением.

Если произвести резкое смещение частиц упругой среды в одном месте, например, с помощью поршня, то в этом месте увеличится давление. Благодаря упругим связям частиц давление передаётся на соседние частицы, которые, в свою очередь, воздействуют на следующие, и область повышенного давления как бы перемещается в упругой среде. За областью повышенного давления следует область пониженного давления, и, таким образом, образуется ряд чередующихся областей сжатия и разряжения, распространяющихся в среде в виде волны. Каждая частица упругой среды в этом случае будет совершать колебательные движения.

В жидких и газообразных средах, где отсутствуют значительные колебания плотности, акустические волны имеют продольный характер, то есть направление колебания частиц совпадает с направлением перемещения волны. В твёрдых телах, помимо продольных деформаций, возникают также упругие деформации сдвига, обусловливающие возбуждение поперечных (сдвиговых) волн; в этом случае частицы совершают колебания перпендикулярно направлению распространения волны. Скорость распространения продольных волн значительно больше скорости распространения сдвиговых волн.

Физические параметры звука

Колебательная скорость измеряется в м/с или см/с. В энергетическом отношении реальные колебательные системы характеризуются изменением энергии вследствие частичной её затраты на работу против сил трения и излучение в окружающее пространство. В упругой среде колебания постепенно затухают. Для характеристики затухающих колебаний используются коэффициент затухания (S), логарифмический декремент  и добротность (Q). Коэффициент затухания отражает быстроту убывания амплитуды с течением времени. Если обозначить время, в течение которого амплитуда уменьшается в е = 2,718 раза, через , то

S = 1/. Уменьшение амплитуды за один цикл характеризуется логарифмическим декрементом. Логарифмический декремент равен отношению периода колебаний ко времени затухания :  = T/

Если на колебательную систему с потерями действовать периодической силой, то возникают вынужденные колебания, характер которых в той или иной мере повторяет изменения внешней силы. Частота вынужденных колебаний не зависит от параметров колебательной системы. Напротив, амплитуда зависит от массы, механического сопротивления и гибкости системы. Такое явление, когда амплитуда колебательной скорости достигает максимального значения, называется механическим резонансом. При этом частота вынужденных колебаний совпадает с частотой собственных незатухающих колебаний механической системы. При частотах воздействия, значительно меньших резонансной, внешняя гармоническая сила уравновешивается практически только силой упругости. При частотах возбуждения, близких к резонансной, главную роль играют силы трения. При условии, когда частота внешнего воздействия значительно больше резонансной, поведение колебательной системы зависит от силы инерции или массы.

Свойство среды проводить акустическую энергию, в том числе и ультразвуковую, характеризуется акустическим сопротивлением. Акустическое сопротивление среды выражается отношением звуковой плотности к объёмной скорости ультразвуковых волн. Удельное акустическое сопротивление среды устанавливается соотношением амплитуды звукового давления в среде к амплитуде колебательной скорости её частиц. Чем больше акустическое сопротивление, тем выше степень сжатия и разряжения среды при данной амплитуде колебания частиц среды. Численно, удельное акустическое сопротивление среды (Z) находится как произведение плотности среды  на скорость (с) распространения в ней ультразвуковых волн. Z = •c Удельное акустическое сопротивление измеряется в Па•с/м (см) или дин•с/см3 (СГС); 1 Па•с/м = 10-1 дин • с/см3. Значение удельного акустического сопротивления среды часто выражается в г/с•см2, причём 1 г/с•см2 = 1 дин•с/см3. Акустическое сопротивление среды определяется поглощением, преломлением и отражением ультразвуковых волн. Звуковое или акустическое давление в среде представляет собой разность между мгновенным значением давления в данной точке среды при наличии звуковых колебаний и статического давления в той же точке при их отсутствии. Иными словами, звуковое давление есть переменное давление в среде, обусловленное акустическими колебаниями. Максимальное значение переменного акустического давления (амплитуда давления) может быть рассчитано через амплитуду колебания частиц: P = 2fcA. где Р — максимальное акустическое давление (амплитуда давления); f — частота; с — скорость распространения ультразвука;  — плотность среды; А — амплитуда колебания частиц среды. На расстоянии в половину длины волны (/2) амплитудное значение давления из положительного становится отрицательным, то есть разница давлений в двух точках, отстоящих друг от друга на /2 пути распространения волны, равна 2Р. Для выражения звукового давления в единицах СИ используется Паскаль (Па), равный давлению в один ньютон на метр квадратный (Н/м2). Звуковое давление в системе СГС измеряется в дин/см2; 1 дин/см2 = 10-1Па = 10-1Н/м2. Наряду с указанными единицами часто пользуются внесистемными единицами давления — атмосфера (атм) и техническая атмосфера (ат), при этом 1 ат = 0,98o106 дин/см2 = 0,98o105 Н/м2. Иногда применяется единица, называемая баром или микробаром (акустическим баром); 1 бар = 106 дин/см2. Давление, оказываемое на частицы среды при распространении волны, является результатом действия упругих и инерционных сил. Последние вызываются ускорениями, величина которых также растёт в течение периода от нуля до максимума (амплитудное значение ускорения). Кроме того, в течение периода ускорение меняет свой знак. Максимальные значения величин ускорения и давления, возникающие в среде при прохождении в ней ультразвуковых волн, для данной частицы не совпадают во времени. В момент, когда перепад ускорения достигает своего максимума, перепад давления становится равным нулю. Амплитудное значение ускорения (а) определяется выражением: a = 2A = (2f)2 A Если бегущие ультразвуковые волны наталкиваются на препятствие, оно испытывает не только переменное давление, но и постоянное. Возникающие при прохождении ультразвуковых волн участки сгущения и разряжения среды создают добавочные изменения давления в среде по отношению к окружающему её внешнему давлению. Такое добавочное внешнее давление носит название давления излучения (радиационного давления). Оно служит причиной того, что при переходе ультразвуковых волн через границу жидкости с воздухом образуются фонтанчики жидкости и происходит отрыв отдельных капелек от поверхности. Этот механизм нашел применение в образовании аэрозолей лекарственных веществ. Радиационное давление часто используется при измерении мощности ультразвуковых колебаний в специальных измерителях — ультразвуковых весах.

Распространение ультразвука

Распространение ультразвука — это процесс перемещения в пространстве и во времени возмущений, имеющих место в звуковой волне. Звуковая волна распространяется в веществе, находящемся в газообразном, жидком или твёрдом состоянии, в том же направлении, в котором происходит смещение частиц этого вещества, то есть она вызывает деформацию среды. Деформация заключается в том, что происходит последовательное разряжение и сжатие определённых объёмов среды, причём расстояние между двумя соседними областями соответствует длине ультразвуковой волны. Чем больше удельное акустическое сопротивление среды, тем больше степень сжатия и разряжения среды при данной амплитуде колебаний. Частицы среды, участвующие в передаче энергии волны, колеблются около положения своего равновесия. Скорость, с которой частицы колеблются около среднего положения равновесия называется колебательной скоростью. Колебательная скорость частиц изменяется согласно уравнению: V = U sin (2ft + G), где V — величина колебательной скорости; U — амплитуда колебательной скорости; f — частота ультразвука; t — время; G — разность фаз между колебательной скоростью частиц и переменным акустическим давлением. Амплитуда колебательной скорости характеризует максимальную скорость, с которой частицы среды движутся в процессе колебаний, и определяется частотой колебаний и амплитудой смещения частиц среды. U = 2fA, где А — амплитуда смещения частиц среды.!

Дифракция, интерференция

При распространении ультразвуковых волн возможны явления дифракции, интерференции и отражения.

Дифракция (огибание волнами препятствий) имеет место тогда, когда длина ультразвуковой волны сравнима (или больше) с размерами находящегося на пути препятствия. Если препятствие по сравнению с длиной акустической волны велико, то явления дифракции нет. При одновременном движении в ткани нескольких ультразвуковых волн в определённой точке среды может происходить суперпозиция этих волн. Такое наложение волн друг на друга носит общее название интерференции. Если в процессе прохождения через биологический объект ультразвуковые волны пересекаются, то в определённой точке биологической среды наблюдается усиление или ослабление колебаний. Результат интерференции будет зависеть от пространственного соотношения фаз ультразвуковых колебаний в данной точке среды. Если ультразвуковые волны достигают определённого участка среды в одинаковых фазах (синфазно), то смещения частиц имеют одинаковые знаки и интерференция в таких условиях способствует увеличению амплитуды ультразвуковых колебаний. Если же ультразвуковые волны приходят к конкретному участку в противофазе, то смещение частиц будет сопровождаться разными знаками, что приводит к уменьшению амплитуды ультразвуковых колебаний.

Интерференция играет важную роль при оценке явлений, возникающих в тканях вокруг ультразвукового излучателя. Особенно большое значение имеет интерференция при распространении ультразвуковых волн в противоположных направлениях после отражения их от препятствия.

Поглощение ультразвуковых волн

Если среда, в которой происходит распространение ультразвука, обладает вязкостью и теплопроводностью или в ней имеются другие процессы внутреннего трения, то при распространении волны происходит поглощение звука, то есть по мере удаления от источника амплитуда ультразвуковых колебаний становится меньше, так же как и энергия, которую они несут. Среда, в которой распространяется ультразвук, вступает во взаимодействие с проходящей через него энергией и часть её поглощает. Преобладающая часть поглощенной энергии преобразуется в тепло, меньшая часть вызывает в передающем веществе необратимые структурные изменения. Поглощение является результатом трения частиц друг об друга, в различных средах оно различно. Поглощение зависит также от частоты ультразвуковых колебаний. Теоретически, поглощение пропорционально квадрату частоты. Величину поглощения можно характеризовать коэффициентом поглощения, который показывает, как изменяется интенсивность ультразвука в облучаемой среде. С ростом частоты он увеличивается. Интенсивность ультразвуковых колебаний в среде уменьшается по экспоненциальному закону. Этот процесс обусловлен внутренним трением, теплопроводностью поглощающей среды и её структурой. Его ориентировочно характеризует величина полупоглощающего слоя, которая показывает на какой глубине интенсивность колебаний уменьшается в два раза (точнее в 2,718 раза или на 37 %). По Пальману при частоте, равной 0,8 МГц средние величины полупоглощающего слоя для некоторых тканей таковы: жировая ткань — 6,8 см; мышечная — 3,6 см; жировая и мышечная ткани вместе — 4,9 см. С увеличением частоты ультразвука величина полупоглощающего слоя уменьшается. Так при частоте, равной 2,4 МГц, интенсивность ультразвука, проходящего через жировую и мышечную ткани, уменьшается в два раза на глубине 1,5 см. Кроме того, возможно аномальное поглощение энергии ультразвуковых колебаний в некоторых диапазонах частот — это зависит от особенностей молекулярного строения данной ткани. Известно, что 2/3 энергии ультразвука затухает на молекулярном уровне и 1/3 на уровне микроскопических тканевых структур. Глубина проникновения ультразвуковых волн Под глубиной проникновения ультразвука понимают глубину, при которой интенсивность уменьшается на половину. Эта величина обратно пропорциональна поглощению: чем сильнее среда поглощает ультразвук, тем меньше расстояние, на котором интенсивность ультразвука ослабляется наполовину.

Рассеяние ультразвуковых волн

Если в среде имеются неоднородности, то происходит рассеяние звука, которое может существенно изменить простую картину распространения ультразвука и, в конечном счете, также вызвать затухание волны в первоначальном направлении распространения. Преломление ультразвуковых волн Так как акустическое сопротивление мягких тканей человека ненамного отличается от сопротивления воды, можно предполагать, что на границе раздела сред (эпидермис — дерма — фасция — мышца) будет наблюдаться преломление ультразвуковых лучей. Отражение ультразвуковых волн На явлении отражения основана ультразвуковая диагностика. Отражение происходит в приграничных областях кожи и жира, жира и мышц, мышц и костей. Если ультразвук при распространении наталкивается на препятствие, то происходит отражение, если препятствие мало, то ультразвук его как бы обтекает. Неоднородности организма не вызывают значительных отклонений, так как по сравнению с длиной волны (2 мм) их размерами (0,1 — 0,2 мм) можно пренебречь. Если ультразвук на своём пути наталкивается на органы, размеры которых больше длины волны, то происходит преломление и отражение ультразвука. Наиболее сильное отражение наблюдается на границах кость — окружающие её ткани и ткани — воздух. У воздуха малая плотность и наблюдается практически полное отражение ультразвука. Отражение ультразвуковых волн наблюдается на границе мышца — надкостница — кость, на поверхности полых органов.

Бегущие и стоячие ультразвуковые волны

Если при распространении ультразвуковых волн в среде не происходит их отражения, образуются бегущие волны. В результате потерь энергии колебательные движения частиц среды постепенно затухают, и чем дальше расположены частицы от излучающей поверхности, тем меньше амплитуда их колебаний. Если же на пути распространения ультразвуковых волн имеются ткани с разными удельными акустическими сопротивлениями, то в той или иной степени происходит отражение ультразвуковых волн от пограничного раздела. Наложение падающих и отражающихся ультразвуковых волн может приводить к возникновению стоячих волн. Для возникновения стоячих волн расстояние от поверхности излучателя до отражающей поверхности должно быть кратным половине длины волны.

Медузы и инфразвуки

На краю «колокола» у медузы расположены примитивные глаза и органы равновесия — слуховые колбочки величиной с булавочную головку. Это и есть «уши» медузы. Однако «слышат» они не просто звуковые колебания, доступные и нашему уху, а инфразвуки с частотой 8 — 13 герц.

Перед штормом усиливающийся ветер срывает гребни волн и захлёстывает их. Каждое такое захлопывание воды на гребне волны порождает акустический удар, создаются инфразвуковые колебания, их-то и улавливает своим куполом медуза. Колокол медузы усиливает инфразвуковые колебания (как рупор) и передаёт на «слуховые колбочки». Шторм разыгрывается ещё за сотни километров от берега, он придет в эти места примерно часов через 20, а медузы уже слышат его и уходят на глубину.

Нужно отдать должное бионикам, которые создали электронный автоматический аппарат — предсказатель бурь, работа которого основана на принципе «инфрауха» медузы. Такой прибор может предупредить о готовящейся буре за 15 часов, а не за два, как обычный морской барометр

Скорость звука

Скорость звука в газах (0° С; 101325 Па), м/сАзот 334
Аммиак 415
Ацетилен 327
Водород 1284
Воздух 331,46
Гелий 965
Кислород 316
Метан 430
Угарный газ 338
Углекислый газ 259
Хлор 206

Скорость звука — скорость распространения звуковых волн в среде.

Как правило, в газах скорость звука меньше, чем в жидкостях, а в жидкостях скорость звука меньше, чем в твёрдых телах.

В воздухе при нормальных условиях скорость звука составляет 331.46 м/с (1193 км/ч).

В воде скорость звука составляет 1485 м/с.

В твёрдых телах скорость звука составляет 2000—6000 м/с.

Скорость звука зависит от температуры — с ростом температуры растет и скорость звука.

понедельник, февраля 18

Скачать гимн звукорежиссера

Скачать гимн звукорежиссера.

среда, февраля 13

Звукозапись

Звукозапись — процесс сохранения воздушных колебаний в диапазоне 20—20 000 Гц (музыки, речи или иных звуков) на каком-либо носителе (грампластинки, магнитная лента, компакт-диск и т. д.) с помощью специальных приборов (микрофон, микшерный пульт, магнитофон и т. д.).

В классическом понятии звукозапись производится в звукозаписывающих студиях на профессиональном оборудовании для достижения максимально возможного качества звука. Здесь различимы два типа звукозаписывающих студий: аналоговые и мультимедийные.

В аналоговых студиях процесс сведения и мастеринга происходит через главный микшерный пульт в реальном времени, а финальный микс записывается на цифровой носитель (DAT-кассета, RAID-массив, жесткий диск и т. д.).

В мультимедийных студиях сердцем является компьютер, оснащенный профессиональным оборудованием, в котором происходит оцифровка сигнала и его последующая нелинейная обработка специальными средствами: сведение и мастеринг.

Сам процесс звукозаписи является уделом звукооператоров (слежение непосредственно за процессом звукозаписи, установка микрофонов и оборудования) и звукорежиссеров (сведение и мастеринг). В недорогих или домашних студиях звукозаписи эти функции исполняет один человек.

Качество записываемого звука зависит непосредственно от нескольких факторов: помещение, в котором происходит звукозапись; микрофоны которые используются при звукозаписи; кабели и оборудование.

Коммерческие студии звукозаписи построены таким образом, чтобы создать полноценную звукоизоляцию для поглощения звуковой волны по всему диапазону. Отдельные помещения строят с учетом записи определенных инструментов (для примера, помещение, где производится запись барабанов, построено на специальном материале, поглощающем низкие и субнизкие частоты во избежание интерференции звуковых волн). При недостатке места зачастую используются пластины с выступами специальной конфигурации (т. н. эхопоглощающие панели).

В профессиональных студиях звукозаписи используются микрофоны для записи вокала и микрофоны для записи инструментов. Вокальные микрофоны, как правило, конденсаторные и оснащены большой диафрагмой для улучшенной передачи вокальных особенностей исполнителя. Такие микрофоны имеют повышенную чувствительность, большой частотный и динамический диапазон, минимальное время реагирования и очень низкий уровень собственных шумов. Инструментальные микрофоны имеют свои особенности в зависимости от назначения (к примеру, более низкую чувствительность и узкий диапазон частот в случае микрофона для записи большой бочки барабанов или суженная диаграмма направленности в случае смычково-струнных инструментов, таких как скрипка или виолончель).

Очень важным фактором в процессе студийной звукозаписи является использование профессиональных разъемов и кабелей. Звукоинженеры используют очень дорогой кабель, обеспечивающим минимальные потери качества аналогового сигнала. Позолоченные контакты и специальное экранирование по всей длине кабеля для удаления индукционных волн разной частоты — лишь несколько факторов построения кабелей звукозаписи высокой проводимости. Звукоинженеры стараются провести самый короткий и качественный кабель от микрофона до блока оцифровки для получения максимального уровня сигнала и минимальных потерь.

Необходимое оборудование: прибор для преобразования звуковых колебаний в электрические (микрофон) или генератор тона (напр., звуковой синтезатор, семплер), устройство для преобразования электрических колебаний в последовательность цифр (в цифровой записи), устройство для сохранения (магнитофон, жесткий диск компьютера или иное устройство для сохранения полученной информации на носитель).

Основные системы звукозаписи:
механическая
аналоговая
цифровая

Материал из википедии

Звукорежиссёр.

Звукорежиссёр, звукоинженер (от английского - sound engineer) — техническая профессия. Звукорежиссер занимается записью, обработкой, воспроизведением звука в студии и за ее пределами (тв каналы, концерты и т.д.) с помощью специальной техники. Профессия нужна в таких отраслях как звукозапись, радио, телевидение, создания звуковой атмосферы для фильмов, техническое обеспечение концертов, обработка звука в студии.

Звукорежиссёр в кинематографе

Звукорежиссёром в кинематографе является участник съемочной группы, руководящий звуковым цехом. Он занимается записью звука, работая напрямую с микрофонным оператором. В задачу звукорежиссёра входит создание озвучания (фонограммы) фильма в соответствии с идейно-художественным замыслом автора сценария и режиссёра

В кинематографе также есть звукооператор — это участник съемочной группы, входящий в состав звукового цеха, работает с записью – отслеживает уровни звука фоновых шумов и звука диалогов.

Ответственность за запись, обработку и создание звука в процессе съемки фильма полностью ложится на звуковой цех.

Состав звукового цеха:

Звукорежиссёр – работает за звуковым пультом, записывает звук. Связан с микрофонным оператором. Командует звуковым цехом (микрофонным оператором и звукооператором).

Микрофонный оператор – обеспечивает расстановку микрофонов, управляет микрофонами в процессе съемки.

Звукооператор – осуществляет технический контроль записи: отслеживает уровень внутрикадрового звука и фоновых шумов.

В настоящее время часто путают понятия звукооператор и звукорежиссёр, хотя оба специалиста играют разные роли в процессе работы над звуком.

Обязанности звукорежиссёра и звукооператора

Звукорежиссёр участвует в разработке режиссёрского сценария, проводит пробные записи звука. В его обязанности входит осуществление и контроль за синхронной звукозаписью. Осуществляет монтаж всех видов звука. В результате его деятельности получается «озвучивание» (Окончательный (конечный) вариант фонограммы фильма, который получается в ходе сведения (перезаписи) всех исходных элементов, составляющих звуковой ряд).
Звукооператор занимается микшированием и контролем за уровнем звука. В его задачу входит приведение уровня звучания диалогов, шумов и музыки в соответсвии с заранее составленной звукорежиссёром экспликацией. Иногда такую экспликацию приходится составлять самому звукооператору во время записи звука, для дальнейшего монтажа.

Значимость звукового решения

Звуковое решение фильма также является художественными произведением. На кинофестивалях существует несколько номинаций имеющих непосредственное отношение к звуковому решению фильма, например: Оскар «Лучшая музыка» , «Лучшая песня», «Золотой глобус» и другие.

Фильм Волшебник страны Оз 1940г. получил награду «Оскар» в номинации «Лучшая музыка» и еще одну награду в номинации «Лучшая песня»
фильм Доктор Живаго 1966г. получил награду «Оскар» — «Лучшая музыка» и награду «Золотой глобус» в такой же номинации.
Космическая одиссея 2001 года 1968 г. получила приз Британской академии в номинации «Лучшая музыка» (саундтрек)

Современные фильмы получившие награды за звуковое решение:

«Саут Парк: большой, длинный, необрезанный» 2000 г.
Награда MTV 2000 - «Лучший музыкальный ряд».
«Матрица (1999г.)
Британская киноакадемия 2000 - Лучший звук
Оскар 2000 - Лучший звук
Оскар 2000 - Лучший звукорежиссёр
Почти знаменит (2000 г.)
Британская киноакадемия 2001 - Лучший звук
Мулен Руж (2000 г.)
Британская киноакадемия 2002 - Лучший звук
Британская киноакадемия 2002 - Награда Энтони Эскуита за музыку
Золотой глобус 2002 - Лучшая музыка
Награда MTV 2002 - Лучший музыкальный ряд

В настоящее время с появлением систем многоканального объёмного звука, значимость работы звукооператора и звукорежиссёра только увеличивается. Без их участия не обходится ни один современный фильм.

четверг, января 31

Dolby Digital (AC-3) что это такое и с чем его едят?

Dolby Digital (AC-3)

Dolby Digital - Общая информация

Звук Dolby Digital впервые появился в кинотеатрах в 1992 с премьерой фильма Возвращение Бэтмена (Batman Returns), и с тех пор звучит почти в тысяче фильмов по всему миру, и является одной из самых современных разработок от Dolby Laboratories.

Dolby произвела революцию в конце 60-х начале 70-х годов в системах записи на магнитную ленту своей системой шумоподавления Dolby A (для профессионалов) и Dolby B (для обычных пользователей). Позже, в 70-х годах, компания Dolby своей аналоговой системой Dolby Stereo революционизировала звук в фильмах.

Dolby Stereo принесла в фильмы 4 звуковых канала, с тремя спереди (левый и правый для музыки и эффектов и центральный для диалогов) и четвертым "окружающим" (Surround) для создания общей звуковой атмосферы. Позже, в 80-х, благодаря системе Dolby SR ("Spectral Recording - спектральная запись"), было значительно улучшено качество записи на ленту и звука в кинофильмах.

Также, компания Dolby революционизировала в конце 80-х начале 90-х годов бытовые устройства развлечений путем внедрения систем "домашнего театра" Dolby Surround, а позже и Dolby Pro Logic. В бытовых устройствах в основном используется технология Dolby Stereo для воспроизведения с видео лент и лазерных дисков (под лазерными дисками здесь и далее подразумеваются LaserDisc, т.е. "большие" видео лазерные диски). Эти системы позволяли зрителям использовать дома ту же самую 4-х канальную конфигурацию, что и в кинотеатрах.

Современные системы Dolby Digital вышли на новый уровень, предоставляя шесть каналов кристально чистого объемного цифрового звука. Левый, центральный и правый фронтальные каналы позволяют точно определить позицию источника звука на экране. Отдельные "разделенные" левый и правый задние боковые каналы вовлекают вас в фильм своими окружающими и обтекающими звуками. А дополнительный низкочастотный канал добавляет накал действию на экране.

Принципы Dolby Digital ведут свое развитие из разработок Dolby по аналоговому уменьшению шума. Шумоподавление Dolby работает путем ослабления шума, когда нет аудио сигнала, а когда он есть, позволяя более сильному полезному аудио сигналу перекрывать более слабый шум. Таким образом, эта технология использует преимущества психо-акустического феномена известного как слуховое маскирование. Даже если аудио сигнал занимает только часть спектра, шумоподавление Dolby уменьшает уровень шума в тех частях спектра, в который нет полезного сигнала делая шум незаметным. Это делается потому, что аудио сигнал может маскировать только ближний по частотам шум.

При переходе от аналоговой записи сигнала к записи на цифровой носитель такой как компакт-диск, обнаруживается, что цифровое кодирование аудио сигналов используемое в CD производит слишком большие объемы данных для того чтобы их эффективно хранить или передавать в электронном виде, особенно в случаях, когда необходимо кодировать несколько каналов. В результате появились новые формы цифрового кодирования аудио сигналов - известных под общим названием "perceptual coding - чувствительное (восприимчивое) кодирование" - которые были разработаны так чтобы можно было использовать низкоскоростные потоки данных с минимально ощущаемой потерей звукового качества. Примером такого алгоритма кодирования является третье поколение кодеров Dolby - AC-3.

Этот кодер был разработан так, чтобы максимально использовать преимущества человеческой способности к звуковому маскированию, для чего он разбивает спектр аудио сигнала в каждом канале на узкие частотные полоски разного размера оптимизированные с расчетом на частотную избирательность человеческого слуха. Это позволяет очень точно отфильтровывать шум оцифровки так, чтобы он оказался очень близко по частоте к частотным компонентам полезного аудио сигнала. Путем уменьшения или даже полной ликвидации шума там, где нет маскирующего аудио сигнала, качество звука исходного сигнала субъективно не изменяется. По этому ключевому аспекту такое кодирование как AC-3 является формой очень избирательного и качественного шумоподавителя.

Уникальный опыт Dolby Laboratories по устранению аудио шума является критическим для снижения потока данных в технологии AC-3: чем меньше бит используется для описания аудио сигнала, тем больше шумов связанных с самим кодированием.

В киноиндустрии звуковая дорожка Dolby Digital кодируется оптически прямо на киноленту в промежутках между перфорационными отверстиями. Размещение цифровой звуковой дорожки на том же носителе что и фильм позволяет ей сосуществовать вместе с аналоговой дорожкой без привлечения дополнительных носителей данных, таких как CD. Это позволяет упростить производство, а для владельцев кинотеатров использование фильмов, а также позволяет подготовить дорожку Dolby Digital практически без дополнительных затрат. Поскольку часть ленты с перфорированными отверстиями изготавливают с расчетом на высокую сопротивляемость износу и повреждениям, дорожка Dolby Digital не будет подвержена треску и шипению на протяжении всего времени эксплуатации ленты.

В бытовой электронике технологию Dolby Digital можно встретить в последнем поколении лазерных дисков (там где была обычная аналоговая звуковая дорожка), она является стандартной звуковой дорожкой в DVD и используется как аудио формат для телевидения высокой четкости - HDTV, а также в системах кабельного и спутникового телевидения.

DOLBY DIGITAL: Вопросы и ответы

Вы вероятно уже много слышали о том, что Dolby Digital это следующий и возможно последний эволюционный шаг в направлении реалистичности звука. Так что же из себя представляет эта новая технология? Чем она отличается от Dolby Surround Pro Logic и какое новое оборудование она потребует? Ответы на эти и на другие вопросы вы получите в этой статье.

Но сначала нужно прояснить вопрос с названиями. Последние несколько лет компания Dolby Laboratories использовала термин Dolby Digital для ссылок на их новую цифровую систему для киноиндустрии, в то время как под термином Dolby Surround AC-3 подразумевала системы домашнего кинотеатра. На практике, эти две системы являются небольшими вариациями (слегка различающимися в скорости потока данных) одной базовой технологии. И для того чтобы больше не вводить пользователей в заблуждение, решили, что и формат Dolby для домашних многоканальных систем также назывался тем же именем, что и в киноиндустрии -- Dolby Digital.

Считается, что это поможет потребителям более легко определять поддерживает ли какой-либо продукт эту технологию, и поможет отличить ее от форматов Dolby Surround и Dolby Pro Logic, которые базируются на аналоговых технологиях. В новом поколении лазерных дисков, и новых форматах использующихся в DVD и телевидении высокой четкости (HDTV), также будут ссылаться на термин Dolby Digital, как это сейчас делают в отношении профессиональных киноприложений. Общее название Dolby Digital также должно помочь прекратить растущие заблуждения пользователей, связанные с термином "AC-3" (Аудио код номер 3), который является техническим обозначением технологии Dolby, разработанной для многоканальных приложений.

Я слышал о Dolby Surround Pro Logic, но что такое Dolby Digital (AC-3)? и что такое Dolby "5.1"?

Dolby Digital предоставляет в общей сложности шесть раздельных каналов звука. Как и Dolby Surround Pro Logic, она включает в себя левый, центральный и правый каналы во фронтальной части комнаты. Dolby Surround Pro Logic предоставляет дополнительно еще один канал с ограниченной полосой частот (от 100 до 7000Гц) для объемного ("окружающего") звука, который обычно усиливается через два канала усилителя и подается потом на два динамика. Тогда как Dolby Digital предоставляет раздельные левый и правый каналы объемного звука для более точного определения местоположения звуков и более натуральной, реалистичной передачи атмосферы и фона. И ко всему прочему все пять основный каналов передают полный спектр частот (от 3 до 20000 Гц), к которым вы можете добавить низкочастотные динамики (сабвуферы).

Шестой канал - Low Frequency Effects Channel (канал для низкой частоты и эффектов), иногда содержит дополнительную низкочастотную информацию для усиления эффекта от некоторых сцен, например, таких как взрывы, катастрофы и т.д. Из-за того, что этот канал сильно ограничен сверху по частоте (от 3 до 120Гц), его иногда называют ".1" каналом. Если его добавляют к полным 5 каналам Dolby Digital, то про такие системы говорят, как про имеющие "5.1" канала.

Все шесть каналов в системе Dolby Digital полностью цифровые, из чего следует, что на всем пути от пульта звукооператора до вашей домашней системы они передаются без потери качества. Но Dolby Digital еще и упаковывает их все в один канал, который занимает места меньше чем один канал на компакт диске. Именно это позволяет так легко добавлять звуковые дорожки Dolby Digital к обычным лазерным дискам, а также к множеству других источников. Dolby Digital используется уже несколько лет, чтобы вы могли смотреть фильмы с Dolby Digital, а теперь, с появлением Dolby Digital на лазерных дисках, вы можете наслаждаться этой прекрасной технологией и у себя дома. А так как она была разработана фирмой Dolby Laboratories, вы можете быть уверены, что звук будет потрясающим!

Это правда что Dolby Digital требует кучу нового оборудования?

Если вы собираете себе новую систему, то можете купить усилители и динамики, специально предназначенные для Dolby Pro Logic, которые подойдут для Dolby Digital. Вам понадобится лазерный проигрыватель нового поколения, на котором есть выход Dolby Digital RF (на него выдается поток данных Dolby AC-3). Основное новое устройство, которое вам понадобится, это декодер Dolby Digital (для декодирования потока AC-3 для дальнейшего воспроизведения). Если у вас уже есть система Dolby Surround Pro Logic, то наверняка уже есть и пятиканальный усилитель, а также необходимое количество динамиков. Рекомендуется добавить сабвуфер, можно даже несколько.

Куда вы записываете дорожку Dolby Digital на лазерном диске? Пропадает ли при этом какая-либо важная аудио информация с лазерного диска? Должен ли я теперь менять всю свою библиотеку лазерных дисков?

Между "обычными" и "новыми" лазерными дисками намного больше общего, чем различий. Новые лазерные диски, включая и диски с Dolby Digital, полностью совместимы с вашим существующим проигрывателем. Две цифровые (PCM) дорожки остаются без изменений, так что вы можете продолжать наслаждаться качеством Dolby Surround Pro Logic и с "новых" дисков. Дорожка Dolby Digital записывается вместо правой аналоговой (FM) дорожки диска. Левая аналоговая дорожка может содержать моно версию, комментарий или любой другой аудио материал.

Последние проигрыватели, которые могли воспроизводить звук только с аналоговых (FM) дорожек, выпускались более чем 10 лет назад. С тех пор практически все проигрыватели могут использовать более качественные цифровые (PCM) дорожки для воспроизведения стерео или Dolby Surround. Конечно же, все новые лазерные проигрыватели с AC-3 будут проигрывать все лазерные диски которые у вас есть, причем как цифровые так и аналоговые звуковые дорожки.

Делает ли Dolby Digital систему Pro Logic ненужной?

Вовсе нет. Dolby Surround Pro Logic еще долго останется с нами. Система Dolby Surround Pro Logic "складывает" четыре канала (левый, центральный, правый и частотно ограниченный "объемный" (Surround)) в два канала. В монофонических системах эти два канала складываются для воспроизведения. И конечно вся информация доступна для воспроизведения в стерео системах. Но когда эти два канала поступают на декодер Dolby Pro Logic, звуковая матрица "раскладывается" и становятся доступными все исходные четыре канала ("объемный" канал воспроизводится через отдельные левый и правый "объемные" динамики).

Самая потрясающая часть системы Dolby Surround Pro Logic это то, что исходный сигнал "уложенный" в стерео, может передаваться вместе с ним везде, где есть возможность передать стерео сигнал: телевизионные стерео передачи, через спутник (C-band, DSS или PrimeStar), кабельные передачи, УКВ (FM) радио, лазерные диски, видео ленты, и даже некоторые игровые приставки. Сегодня вы можете слушать звук в системе Dolby Surround во множестве регулярных телевизионных программах, в растущем списке компакт дисков и конечно на VHS и лазерных дисках, на которых записаны тысячи фильмов с системой Dolby Stereo (термин Dolby Stereo означает то же самое что и хорошо вам известный Dolby Surround, но применяемый в киноиндустрии). Поэтому пока у нас есть стерео, то будет и Dolby Surround Pro Logic, и поэтому все декодеры Dolby Digital имеют встроенный декодер Dolby Pro Logic.

В следующей таблице проводится сравнение свойств Dolby Digital и Dolby Surround Pro Logic.

Параметр	Dolby Digital	Dolby Surround Pro Logic
"Объемный" канал	Стерео, полночастотный (3-20000 Гц).	Монофоничекий, с ограниченным спектром (100-7000 Гц).
Низкочастотный канал	Да (3-120 Гц).	Нет
Панорамирование	Разнообразное	Слева направо, справа налево, спереди назад и наоборот.
Каналы	6 отдельных, все каналы могут быть активны одновременно и независимо друг от друга.	4 производных, может воспроизводится только один преобладающий сигнал в каждый момент времени.
Разное	Улучшенная картина звука, благодаря "time alignment - выравниванию по времени", т.е. заставляет динамики звучать так, как будто они находятся от слушателя на одинаковом расстоянии.	Экономное решение задачи получения высококачественного объемного звука.
	При снижении общей громкости в звуковых дорожках динамичных фильмов (например, когда действие происходит поздно ночью), соответствующим образом подстраивается компрессия, так чтобы сохранить качество тихих фрагментов.	Объемный звук от любого незакодированного источника стерео звука.
	Декодеры могут быть настроены так, чтобы направлять низкочастотный звук в специальные каналы, для систем с сабвуферами.	Совместим со всеми существующими и будущими стерео форматами.
	Драматический шаг вперед по вовлечению слушателя в мир реальных звуков. Беспрецедентные творческие возможности для производства и управлению звуком.	Представляет собой значительный шаг вперед от обычного стерео звука. Является мировым стандартом.

На данный момент существует огромное количество источников звука, поддерживающих Dolby Pro Logic. А как насчет Dolby Digital? На что еще можно записывать Dolby Digital кроме лазерных дисков?

У Dolby Digital есть одна прекрасная вещь - большая гибкость кодирования. Dolby Digital технически допускает огромное разнообразие форматов, а некоторые из них появятся в самое ближнее время:

Телевидение высокой четкости (HDTV). Эта новейшая система одной из первых выбрала Dolby Digital своей основной звуковой подсистемой. Выбор был сделан "Grand Alliance" - организацией устанавливающей все стандарты для систем HDTV в США.

Спутниковое телевидение - Direct Broadcast Satellite (DBS) уже сегодня активно использует такие преимущества системы Dolby Digital как высокое качество и простота передачи. К примеру, служба "DMX for Business" использует Dolby Digital для передачи 120 музыкальных стерео каналов, и все они передаются с одного передатчика. PrimeStar планирует в ближайшее время добавить Dolby Digital к свой службе телевизионной спутниковой передачи.

Кабельное телевидение внедряет системы с Dolby Digital из-за соображений эффективности и для того чтобы быть готовым к стандартам будущих систем телевидения высокой четкости.

В формат Digital Video Disc (DVD) уже входит Dolby Digital.

Остальные форматы, такие как цифровые видеокассеты - Digital Video Cassette (DVC), и цифровая аудио передача - Digital Audio Broadcast (DAB), являются первыми в списке на внедрение уникальной комбинации качественного звука, эффективной передачи всего спектра сигнала и многоканальных возможностей технологии Dolby Digital.

Что делает Dolby Digital таким гибким, или если уж говорить прямо - чем он хорош?

Буквы "AC" в Dolby AC-3, расшифровываются как Audio Coding - кодирование звука. На цифровое кодирование звука часто ссылаются как на "perceptual coding" (кодирование основанное на ощущениях). Проще говоря, это такое кодирование, которое пытается обнаружить и затем удалить ту звуковую информацию, которую мы все равно не может услышать, но сохраняет то, что мы можем услышать. Его назначение уместить как можно больше полезной информации в доступном спектре. Рассмотрим аналогию:

Предположим, что вам необходимо доставить 4000 человек (полезная информация) из одного места в другое в течении часа. По шоссе может проехать только 1000 машин в час. Если разместить все 4000 человек в 1000 автомобилей, то можно избавиться от лишней информации (оставим 3000 машин дома). Это высокоэффективная доставка, и именно для этого предназначена система Dolby Digital.

Одна из причин, почему качество звука на компакт диске так высоко в том, что он содержит огромный объем данных: 16-ти разрядные семплы выбираются 44100 раз в секунду отдельно для каждого канала. Это соответствует потоку в 1411200 бит в секунду. Компакт диск представляет собой настолько большое хранилище информации, что позволяет записать до 74 минут музыки на один диск. Но что делать, если надо записать 2 часа 20-ти разрядного сигнала и ко всему прочему там должно быть шесть каналов? На сегодняшний день такой большой поток данных непрактичен ни для хранения, ни для передачи.

Кодер Dolby Digital является первым кодером разработанным специально для многоканального звука. Уникальный опыт Dolby Laboratories по устранению аудио шума является критическим для снижения потока данных, потому что чем меньше бит используется для описания аудио сигнала, тем больше шум.

Шумоподавление Dolby работает путем уменьшения уровня шума в отсутствии аудио сигнала, а также позволяя более сильному полезному аудио сигналу перекрывать или "маскировать" шум. Но это позволяет замаскировывать только шум, близкий по частотам к полезному сигналу. Поэтому Dolby Digital разбивает звуковой спектр для каждого канала на узкие полоски разного размера, оптимизированные с расчетом на частотную избирательность человеческого слуха. Это позволяет очень точно отфильтровывать шум оцифровки так, чтобы он оказался очень близко по частоте к частоте кодируемого сигнала. Аудио сигнал эффективно заглушает шум, делая его неслышным для уха. Там где отсутствие сигнала не позволяет маскировать шум оцифровки, Dolby Digital прикладывает максимум усилий чтобы его уменьшить. Можно сказать, что Dolby Digital это очень эффективная система шумоподавления, и в результате качество звука субъективно очень близко к оригиналу.

Dolby Digital использует технологию "shared bitpool" ("разделяемых битов"), и также модель маскирования человеческого слуха, чтобы достичь наибольшей эффективности передаваемых данных. Разряды неравномерно распределяются между множеством узких полосок частоты, причем в каждом конкретном случае по-разному, в зависимости от спектра и динамической структуры кодируемого сигнала. Применяя модель слухового маскирования, кодер предоставляет оптимальное количество разрядов для аудио сигнала в каждой полосе. Дополнительно происходит перераспределение разрядов между разными каналами в соответствии с моделью, по которой более насыщенный частотами канал потребует больше данных для передачи, чем другие, слабо заполненные, а также учитывается, что сильный сигнал в одном канале может маскировать появляющийся шум в других каналах. В результате Dolby Digital может использовать пропорционально больше передаваемых данных для кодирования звука, выдавая более качественный сигнал и позволяя кодировать несколько звуковых каналов в более низкоскоростные потоки данных чем требует даже один канал на компакт диске.

ТЕХНИЧЕСКИЕ ДАННЫЕ

Кодер Dolby Digital способен обработать входной сигнал с, по крайней мере, 20-ти разрядным динамическим цифровым сигналом с диапазоном частот от 20 до 20000 Гц ±0.5 дБ (-3 дБ на 3 и 20300 Гц). Низкочастотный канал покрывает диапазон от 20 до 120 Гц ±0.5 дБ (-3 дБ на 3 и 121 Гц). Поддерживаются частота дискретизации в 32, 44.1 и 48 кГц. Ширина выходного потока данных может варьироваться от минимума в 32 кбит/сек для одного монофонического канала, до максимума в 640 кбит/сек, удовлетворяя всему возможному диапазону требований. Типичными являются скорости в 384 кбит/сек для "5.1" канального Dolby Digital потребительского формата, и 192 кбит/сек для двух канальной передачи звука.

Комментарии к переводу:

Некоторые термины не поддаются однозначному переводу, так как им нет однозначно соответствующих по смыслу слов в русском языке в употребляемом контексте, а именно "Surround" (окружающий, обтекающий, объемный) и "Perceptual Coding" (имеется в виду кодирование, основанное на психоакустической модели слуха человека, имитационная модель).

Под термином лазерный диск понимается "большой" лазерный диск (Laser Disc), не путайте его с "маленькими" компакт дисками (CD). В настоящее время они вытисняются получающими все большее распространение, более современными, дешевыми и удобными DVD дисками.

Статья взята с сайта журнала iXBT.com

http://www.ixbt.com/multimedia/dd_ac3_faq.html

Как записать DVD-Audio на диск?

Особенности записи DVD-audio в Nero

Запись DVD-Audio в программе
Nero как специализированный формат до версии
Nero 6 не поддерживается. В новой версии
Nero 6.6 приобретенной мною появление формата
DVD-audio ответом на множество вопросов.

Любой поиск внятной информации о алгоритме записи подобного формата
приводит к неудаче. В РУнете имеется много ресурсов описывающих
особенности подобного формата. Часто эти ресурсы бывают одними из
популярных -

ixbt.com,
http://www.sacd.ru/format.htm,
технология записи,
международные и
российские новости,
DVD-A
Advanced Resolution,
Цифровой
звук,
http://www.digitalvideo.ru/ . Ознакомившись с большим количеством
мнений на эту тему вы сможете сформировать собственное мнение.

Прежде чем, что то сказать хочу умерить ваш интерес с формату
DVD-audio. Прежде всего если речь идет о аудио,
то сразу имеется введу стерео звук. Став счастливым обладателем домашнего
кинотеатра с высококачественной акустикой каждый любитель качественного
видео и звука сразу становится экспертом по оценке качества. В широкой
продаже сегодня можно купить за 100-150 рублей диски
инструментальных и студийных альбомов почти всех звезд. Для оценки
качества звука вы можете использовать программу

CloneDVD. Она сразу дает оценку
звуковых дорожек AC-3/6(звук 6 каналов) или
AC-3/2(стерео).

Теперь коротко изложу свой скромный опыт по записи дисков с форматом
DVD-Audio. Я попытался записать диски в версии
программы Nero 6.6. Прежде, чем записывать
подобный формат нужно предупредить вас о том, что для записи подобного
формата не подходят привычные всем wav файлы
полученные грабблением например программой

AudioGrabber. Для записи DVD-Audio
нужен специально подготовленные форматы файлов *.mp4
или *.aac. Как подготавливать эти файлы
профессионально, я пока не знаю. Приобрести специализированный да еще и
профессиональный софт с соответствующим оборудованием в виде звуковой
студии не предоставляется возможным. Да и считать себя маньяком мне
как то не хочется. Для любительского создания подобных файлов *.mp4
или *.aac достаточно сопутствующей
Nero 6.6 приложению или
Nero приложениях. Во всем остальном принцип
записи DVD-audio формата ничем не
отличается от записи обычного audio диска.
Кратко изложу последовательность ваших действий при записи
DVD Audio:

Запускаем Nero Express удобно направляющий ваши
действия в выборе DVD Audio формата. Выбираем
картинку нотку как показано на ниже лежащем рисунке.

Затем все при записи DVD-audio становится
привычным, за исключением поиска файлов с форматом *.mp4
или *.aac.

После
появления диалогового окна управлением по формирования проекта
DVD audio вам нужно просто нажатием кнопки
"Добавить" вставлять в проект файлы формата *.mp4
или *.aac подготовленные в
Nero приложениях. В остальном сам принцип
записи полностью аналогичен записи аудио диска CD.

Так же хочу упомянуть особенности привычных DVD Video
плееров новых форматов. Многие корейские и китайские версии этих
плееров заявляют о поддержке DVD audio. Подобных
дисков на конец 2004 года в широкой продаже найти трудно! К тому же
многие рисуют вопрос на против файлов Wav в то
время воспроизводя mp3 файлы. К тому же не
центрированные диски имеющие дефекты окружности вибрируя в плеере не
читаются. Из этого рождается новая байка китайские плееры не читают
китайские и украинские пиратские диски. При выборе плеера отдавайте
предпочтение европейцам и американцам. Они хоть и по дороже зато читают
даже расплывчатые поверхности дисков. Просто перед покупкой купите
китайский диск за сто рублей с как можно дерьмовым видом. Выбирая плеер в
магазине испытайте плеер на чтение. Тут все и выяснится...

В заключении после того как в нижней части полоса дойдет до красной черты
4,5Гб запишите диск нажатием с начало "далее" и затем нажатием
кнопки"запись". Вот и весь секрет записи DVD Audio.

Статья взята с сайта: softhelp.ru

среда, января 16

4 Front OSS/3D R7

Вот тута вопрос возник - поставить прибамбасы к проигрывателю типа DFX (для улучщения качества звучания).И надыбал я надысь через порталину "Кап Немо" информейшн об одном превосходном девайсе 4 Front OSS/3D 7.0 (Site http*://oss3d.com/download.html) - что
являеться проф. инструментом для людей из мира музыки (но конечно не таких как Филя Киркоров и Боря Моисеев).

Короче прога мочит саунд как надо и DFX, как говориться ("Деточка, а вам не кажеться, что ваше место возле параши") и рубит басы по самые не балуйся - и вообще настроек там много - и очень даже хороших.

4Front 3D Surround
This technology expands audio environment out of actual speaker positions. Normally, the sound only in between of the

speakers can be heard, but with use of 3D Surround it is possible to widen perceived sound image without changing physical

speaker positions. Technology has 3 modes of operation: Normal, Extended, Overdrive, and allows to control smoothly

distribution of stereo image and bass presence.

4Front extSpace
This type of processing creates a virtual re-sounding speaker frame behind the listener position and bounces the sound as if

it was coming from rear speakers. While the effect utilizes only two speakers, the resounding frame is emulated in 3D space.

The width of the resounding frame gives the spatialization effect.
extSapce operates in two modes: Active and Wide. It gives maximum impression, when used together with 4Front 3D Surround.

4Front extFX
This kind of technology represents an aggresive type of surround sound remixing. This effect includes two options: Center and

Space and allows to control distribution of center material vs surround.

4Front Fidelity
Fidelity processing enhances signal and recreates missing high frequency harmonics, which may be lost due to MP3 compression

or poor stereo system. This is a basic way to restore high frequency contents.

4Front Extended Fidelity
Extended fidelity is a full featured high frequency harmonic synthesizer, with controls, which are recognized on many

professional enhancers. Extended Fidelity can improve speech legibility, brush up orchestral sound, help in restoring old

records, improve practically any kind of material.

4Front Virtual Subwoofer
This type of processing expands bass frequencies like real subwoofer does. Bass frequencies are well spread around stereo,

only two speakers are needed to emulate surround subwoofer.

4Front SpeakerTool
SpeakerTool includes fixes for common speaker problems (such as annoying resonances, improper phase, inadequate frequency

response).

4Front N-band Equalizer
High quality N-band graphic equalizer that never clips or distorts. Algorithm is very optimized and CPU lightweight. The

default frequency scale is compatible to professional N-band equalizers. Each of the band can be driven -20dB...+20dB without

causing distortion, clip or overflow.
(Will go into Winamp2.9 as generic PCM equalizer)
(Available separately for Winamp3)

4Front Reverb
Professional quality room reverberation algorithm. Fully implemented in integer arithmetic, is very CPU lightweight.
This technology emulates natural room reverberation response, and is suitable to use in professional audio, gaming,

entertainment and other environments

4Front GRC3
GRC3 is a high quality realtime resampling algorithm, which is capable of processing 24-bit signal. Contains 6 modes of

quality operation, is very CPU lightweight, fully implemented in integer arithmetic, currently is used as sample rate

converter in 4Front Open Sound System.

4Front TheatreFX
Virtual 6-speaker system, which is capable of playing back 5.1, 6.1 and even 7.1 material through standard stereo system.

Technology uses speaker virtualization and room response emulation to achieve rich impression of true surround speaker set.

4Front Surroundizer
The technology decodes 2-speaker material for surround playback.

Как получить данную прогу:
Два варианта
1.
Вы культурно посещаете офф.сайт http*://oss3d.com
и скачиваете понравившуюся вам конфигурацию программы (есть даже под пингвина)
триальную 30 дневную версию затем неспеша заходите на любой кряковский поисковик и о чудо отыскиваете изумительнейший патч от

товаришча E_O_D UCF - который нихрена не работает - (выложил я его дабы не обременять Вас излишними проблемами в поиске сей

чудной загогулины).

http*://oss3d.com/download.html

OSS/3D 7.0
3.9 Mегатонн
Winamp 2, 3, 5,
WMPlayer 9,
musicmatch,
Sonique
http*://oss3d.com/files/oss3dr7-demo-i.exe

OSS/3D 7.0 Foobar2000
1 Mегатонна
http*://oss3d.com/files/oss3dr7-foo-demo-i.exe

И наконец второй способ - некультурный:
Как бы невзначай, забредаете на порталище моих земляков-сибиряков http*://slesh.perm.ru (http*://slesh.perm.ru/index.php?ID_PAGE=1)
в новостной отдел - и вдалбливаете в поисковик по сайту великую фразу OSS/3D (он справа находится)
после чего вас побросает по сайту горячих сибирских парней чуть чуть,
и выведет, как в сказке, на страницу высокоскоростной линии FTP - (не побоюсь этого слова) загрузки - <давнлоад>.
где даются полные инструкции по заливке софта с портака.

ftp://slesh.perm.ru/media/snd-oss3dr7.0/snd-oss3dpluginr7.0(foobar2000version).full.zip

после чего (как у меня было) - вбиваете в закачаватель ссылку и сидите у компостера полдня, слегка взгрустнувший оt жестокой
действительности и ошшушуния дикой скорости загрузки - (я скачивал 2.5 часа 2 варианта проги - по частям с перерывами по 0.5

часа)

И становитесь счасливым обладателем ретайловской проги, под именем Миши Мясы - аглицкого джентльмена.

Наслаждаясь в последствии просмотром кинофильмофф, в режиме домашнего кинотеатра, имея всего две колонки
или слушая превосходные композиции различных ВИА - в режимах несовместимых для чиловического уха (особенно это ощущается при гипернизких частотах - я и не думал что мои с-90 способны на такое извращение) , а не песню "Голубая луна" одноименого автора.

P.S.

А ещё для звука классная вещь - XMMS. Звучит значительно приятнее стандартного движка WinAmp'а. Есть движок от XMMS под винды

(хотя и несколько отличается от линуксового по ощущениям). Ставится он просто: распаковываем in_mpg123 в папочку Plugins

WinAmp'а. Нажимаем Ctrl+P, аходим в Input, выбираем Nullsoft MPEG audio decoder (in_mp3.dll). В его свойствах вместо "MP3;

MP2; MP1" оставляем только "MP2; MP1". А для MP3 ставим галочку "Enable" в Snibatch mpg123 plug-in.
http*://rapidshare.de/files/1764844/in_mpg123_118ot31b.zip.html

Альтернативный mp3 декодер для winamp, основанный на mpg123. Очень хорошая вешь. Вот ссылка

http*://www3.cypress.ne.jp/otachan/in_mpg123.html на страницу автора. Там можете скачать последнюю версию.

В дополнение о том как получить качественній звук из винампа...
Набор из алтернативных декодеров.
Ставим соглашаясь с прелагаемыми установками, потом самим ручками можно выставиль качество декодирования и покруче если

загрузка процессора не смущает.
http*://www.shokk.azov.net/MAD/wa-set.exe
далее...
Вроде последний декодер MAD
заливаем его в plagins поверх уже лежащего там после wa-set.exe. Плюс тоже в насторйках ставим качество на вкус (у меня по

максимуму, но вроде зависит от звуковухи, эксперементируйте)
http*://www.shokk.azov.net/MAD/in_mad.dll
...
Ну и альтернативный японский декодер in_mpg123.dll
(я поставил его и выкинул in_mp3.dll, вроде все работает и очень неплохо)
http*://www.shokk.azov.net/MAD/in_mpg123.dll

"Ozone iZotope plugin" для Windows Meidia Player
http*://rapidshare.de/files/1760850/Ozone_Izotope_plugin.rar.html

http*://rapidshare.de/files/1752082/iZotope_for_Winamp_1.0___kg_.rar.html

Автор текста: Zemelya

суббота, января 12

Как соотносятся сложность музыкальной композиции и сложность кодирования с потерями?

Как соотносятся сложность музыкальной композиции и сложность кодирования с потерями?

Сложность композиции имеет мало общего со сложностью ее кодирования. В Интернете давным-давно получил распространение миф (до сих пор любимый многими "меломанами") о том, что для сжатия классической музыки принципиально нужен больший битрейт, чем для современной рок и поп-музыки. О наивности подобных утверждений говорит хотя бы тот факт, что при использовании режима VBR кодек зачастую отводит на классику значительно меньшее число бит, чем на, скажем, хард-рок композиции. Впрочем, есть интересные исключения. Звуки некоторых нструментов, которые вполне могут встретиться в произведениях классиков, достаточно сложны для компрессии. Так, звук скрипки или клавесина может потребовать большего количества бит, чем электрогитара. Однако в целом ситуацию это обстоятельство практически не меняет. Также нельзя говорить о пригодности того или иного кодировщика для сжатия музыки определенного стиля. Это как минимум неразумно. И хотя компрессия некоторых звуков (так называемые проблемные сэмплы) может происходить не так гладко, как хотелось бы, в целом будет корректнее говорить не о жанре произведения, а об используемых инструментах, характере музыки и т.д. Ведь кодеру совершенно неважно исполняет кто-то Моцарта на баяне или же пытается исполнять песенки Бритни Спирс под аккомпанемент клавесина.

В отличие от классики, обычно без серьезных проблем ужимаемой любым современным кодеком (если речь опять же не идет о произведениях, использующих некоторые из вышеупомянутых инструментов), некоторые произведения, написанные с использованием синтезированных инструментов (электроника, транс и т.д.), с трудом поддаются компрессии даже с использованием максимально возможных битрейтов и настроек кодировщика. Примером может служить Karl Bartos со своей The Camera, решительно не желающей кодироваться без искажений. Впрочем, данное произведение, не содержащее ни одного живого звука можно скорее рассматривать в качестве исключения.
Отношение человека к качеству звука - это отдельный вопрос. И если мало кто из поклонников джаза или классики позволит себе архивирование любимой композиции в Xing MP3 128kbps, то, скажем, любитель творчества незабвенной группы Руки Вверх /* с течение времени название группы можно заменить на другое модное */ вряд ли с подобным трепетом отнесется к новому хиту кумира (да и навряд ли этот хит сильно пострадает от подобных действий).

Что такое "эффект пустышки"?

Что такое "эффект пустышки"?

Во многих случаях люди, не принимающие психоакустическую компрессию, имеют дело с так называемым "эффектом пустышки" (от англ. placebo effect), когда личные предпочтения испытуемого в значительной степени влияют на результат исследования. Например, человек, уверенный в своих ушах, при прослушивании компакт диска на своей "навороченной" домашней стереосистеме может быть уверен в том, что он звучит идеально. Достаточно поставить тот же диск, сказав, что он записан из набора MP3 файлов, скачанных из Интернета, как в записи обнаружится множество "недочетов". Для устранения "эффекта пустышки" чаще всего прибегают к слепому или ABX тесту. Применительно к звуковым кодекам суть теста состоит в следующем: берутся два различных файла (обычно это короткие фрагменты записи, длительностью 5-30 секунд), представляющих из себя две версии одного произведения, кодированные с разными параметрами, или же референсный и декодированный файл. Уровни громкости файлов выравниваются (незначительное повышение громкости часто воспринимается как улучшение качества) и запускается программа-тестер. Пользователю дают возможность прослушать два файла, "A" (воспроизводится нажатием на кнопку A) и "B" (соответственно, кнопка B). Прослушивать файлы можно сколь угодно долго. После этого предлагается прослушать звуковой фрагмент X, случайно выбранный из A/B и попробовать определить его: X=A или X=B. После того, как решение принято, цикл повторяется... Для того, чтобы определить, действительно ли заметна на слух разница, обычно бывает достаточно десятка-двух таких циклов. По окончании работы программа в виде числа выводит вероятность того, что пользователь выдавал ответы, случайно нажимая на кнопки. Понятно, что если она составляет доли процента, то человек действительно слышит разницу. Схема действия программ может меняться, однако принцип остается неизменным: пользователь до конца эксперимента не должен знать, какой именно фрагмент воспроизводится.

Название же наблюдаемого эффекта, произошло из медицинской практики, когда больной поправлялся только за счет уверенности в том, что прописанная ему пилюля (состоящая из крахмала и других безвредных веществ) явлется новейшим эффективным препаратом, о чем ему сообщалось заранее. Самовнушение - великая штука... Так что не удивляйтесь, "узнав", что специальный гель, нанесенный на DVD диск, улучшает контрастность изображения или кабель стоимостью в $10 000 способен преобразить звучание любой акустической системы (а, будучи подключенным к лампе, превращает ее в источник солнечного света).

Можно ли осуществить преобразование из одного потокового формата аудио данных в другой?

Можно ли осуществить преобразование из одного потокового формата аудио данных в другой?

Да, такое преобразование возможно. Если речь идет о цифровых потоках, сжатых специальными lossy-алгоритмами (такими как MPEG, WMA, TwinVQ и проч.), то преобразование из одного типа в другой неизбежно влечет за собой потерю качества, так как для преобразования необходимо сначала декодировать исходный поток (качество которого заведомо отличается от оригинала), а затем снова сжать, используя необходимый компрессор (или просто записать в виде абсолютно кодированном виде, иначе говоря, не сжатом). Таким образом, при осуществлении "перекодирования" в новый формат (не в случае простого декодирования в .WAV) происходит фактически двойная потеря качества (относительно качества оригинального сигнала). Под потерей качества следует понимать не только потерю частотных составляющих в некоторых областях спектра сигнала, но и появление различных дополнительных шумов, помех, а также, потерю информации о сигнале в каналах (потерю оригинального стерео).

Если же речь идет об преобразовании формата хранения абсолютно кодированных данных, то существует большое количество программ-конверторов, позволяющих выполнять такое преобразование. Однако следует учитывать, что, например, конвертирование из PCM в ADPCM по своей сути приводит к ощутимым потерям качества, а при конвертировании данных с понижением разрядности сигнала происходит не только потеря оригинального качества, но и появление шумов. С уровнем шумов можно бороться (например, с помощью дизеринга - добавления псевдослучайного белого шума), однако совсем избавиться от них не удается. Поэтому, лучше по возможности не прибегать к таким преобразованиям. В случаях же, когда конвертирование неизбежно, следует быть предусмотрительным и стараться заранее сохранять звуковые данные в абсолютном виде с максимальным качеством (при максимально возможных параметрах), чтобы процесс конвертирования происходил с минимальными потерями.

Можно ли осуществить преобразование WAV в MIDI, WAV в трекерный модуль?

Другими словами, можно ли преобразовать цифровой поток (будь то .WAV или .SND файл) в файл формата MIDI или трекерный модуль (например, .XM или .IT)? На этот вопрос есть почти однозначный ответ: эта задача не решаема принципиально.

Оцифрованное аудио представляет собой, фактически, набор чисел, описывающих значение амплитуды сигнала в каждый момент времени. MIDI-файл - это принципиально иная структура, где хранятся команды, управляющие генераторами и прочими органами звукового синтезирующего устройства. Трекерный модуль представляет собой набор инструментов (оцифрованных звуков), используемых в данной конкретной музыкальной композиции, и набор команд для управления трекером (то есть набор команд, указывающих последовательность воспроизведения инструментов, а также устанавливающих параметры воспроизведения последних).

Таким образом, для того, чтобы, скажем, преобразовать оцифрованную музыку в формат MIDI необходимо качественно проанализировать весь исходный цифровой поток и однозначно определить, звучание каких инструментов необходимо будет задействовать в выходном MIDI-файле. То есть, фактически необходимо точно идентифицировать инструменты, входящие в композицию. Однако эта проблема, по крайней мере на сегодняшний день, почти не решаема. Посудите сами: для того, чтобы правильно определить звучание какого инструмента происходит в данный момент, нужно, грубо говоря, однозначно знать спектры всех возможных инструментов. И затем, сравнивая спектр звучащего инструмента с набором спектров известных инструментов, определить звучание какого инструмента мы слышим. Но в тоже время мы знаем, что спектр одного и того же инструмента может сильно измениться даже при небольшом изменении силы воздействия на него, а это в свою очередь означает, что однозначно получить спектр мы не можем. Но все сказанное касалось звучания только одного инструмента. А что же будет со спектром сигнала, если в него входит звучание сразу нескольких инструментов? Спектр изменится коренным образом! Вы скажете, что можно, наверное, определить звучание по формантным областям. Да, это возможно, однако говорить все же о точности определения не приходится. Да и проблема-то не заканчивается точной идентификацией инструментов. В дальнейшем придется точно определять тональности звучания, расстановку во времени и тому подобное. По этой причине можно сделать однозначный вывод: качественное преобразование цифровых потоков в MIDI невозможно в принципе.

Справедливости ради нужно сказать, что существует некоторое количество программ, которые позволяют переводить простые одноголосые композиции в MIDI-партитуру.

Можно ли перевести цифровой поток в трекерный модуль? Нет, нельзя по приведенным выше причинам. Более того, так как в трекерных модулях (в отличие от MIDI) хранятся кроме команд и сами используемые в композиции инструменты, то для того, чтобы перевести поток в трекерный модуль, из него нужно вычленить звучание отдельных инструментов. А эта задача равносильна вычленению, например, голоса из песни (караоке). То есть, это возможно в какой-то мере, но вычленение несомненно будет крайне некачественным, так как спектры инструментов чаще всего наложены друг на друга.

Можно ли выделить из аудио потока звучание конкретного инструмента или голоса?

Можно ли выделить из аудио потока звучание конкретного инструмента или голоса?

Такая процедура невозможна принципиально. В целом, существует, конечно, способ выделения голоса (т. н. Karaoke), однако он работает не всегда, и уж тем более не стоит ожидать от него качества. Обычно, голос исполнителя "находится" посредине стерео панорамы. Основываясь на этом, можно попробовать вычесть один канал из другого, удалив таким образом звучащее посредине - на этом механизме основана реализация караоке. Очевидно, что такой способ не дает качественного результата, если дает вообще какой-то результат.

Что же касается вычленения звучания каких-то инструментов, то этот вопрос аналогичен предыдущему (точнее, третий абзац предыдущего вопроса).

Какие существуют способы преобразования MIDI в WAV?

Какие существуют способы преобразования MIDI в WAV?

Таких способов много. Попробуем их перечислить.

Если речь идет о переводе в WAV-файл MIDI-композиции с какого-нибудь аппаратного концертного синтезатора, то существует несколько вариантов. Самый простой, вероятно, просто подключить выход синтезатора ко входу звуковой карты компьютера и оцифровать необходимую композицию стандартными методами с помощью какого-нибудь звукового редактора.. Однако этот способ хорош в том случае, если у подключаемого аппарата имеется цифровой выход, а у звуковой карты цифровой вход, так как в этом случае фактически просто произойдет запись цифрового потока с синтезатора в память компьютера, что не повлечет за собой абсолютно никакой потери качества звучания. Если же речь идет об аналоговом соединении аппаратуры, то в таком случае вышеописанный вариант не является удачным, так как внутренние шумы аналоговой части аппаратуры, а также внешние наводки со стороны других устройств могут сильно исказить сигнал и в результате полученный оцифрованный сигнал (.WAV) будет шуметь. Таким образом, если нет возможности осуществить цифровую передачу, можно или удовлетвориться аналоговым соединением или поступить иначе: "перегнать" необходимую MIDI-композицию с синтезатора в компьютер в MIDI-файл и уже MIDI-файл в компьютере доступными средствами оцифровать в .WAV. Однако здесь тоже существуют несколько вариантов.

Для того, чтобы "перегнать" .MID (или файл в ином формате, содержащий MIDI-данные) в .WAV необходимо располагать или звуковой картой со встроенным аппаратным MIDI-синтезатором, или воспользоваться каким-то программным MIDI-синтезатором. Из наиболее распространенных программных синтезаторов можно выделить следующие три: WaveSynth фирмы Creative Labs (поддерживает стандарт GM - General MIDI), Virtual Sound Canvas VSC-88 фирмы Roland (GS - General Synth) и S-YXG100 или S-YXG50 фирмы Yamaha. Следует отметить, что последний качественно отличается от остальных поддержкой стандарта XG (eXtended General). Хотя это тема отдельного обсуждения, следует оговориться все же, что если вы перенесли MIDI-композицию с одного синтезатора и попытаетесь воспроизвести ее на другом (отличном от оригинального), то звучание на нем перенесенной композиции наверняка будет иным (если не абсолютно иным). Эта оговорка особенно касается переноса композиции с концертного синтезатора на компьютер для последующего "перегона" в .WAV, о чем мы говорили выше.

А теперь, собственно, способы преобразования .MID - .WAV.
Самый простой и самый "лобовой" - это соединить выход звуковой карты с ее входом, запустить программу для записи (предварительно выбрав устройством записи соответствующего вход) и включить воспроизведение .MID используя аппаратный или программный синтезатор (следует заметить, что такой вариант подключения имеет смысл только если карта полнодуплексная, то есть умеет одновременно воспроизводить и записывать; если нет, то можно установить вторую дополнительную звуковую карту). Однако, если мы говорим об аналоговых входе и выходе, то такой способ просто испортит оригинальное звучание помехами и шумами, так как фактически сигнал претерпит два лишних взаимообратных преобразования (цифро-аналоговое и аналогово-цифровое) и в придачу наводки на соединительный кабель внесут свои погрешности.

Второй способ аналогичен первому в подходе. Дело в том, что, например, звуковая карта Creative SB Live! позволяет безо всяких физических подключений в качестве устройства записи (входа) использовать, грубо говоря, слышимое в колонках. Иначе говоря, в стандартном микшере Windows в списке устройств записи есть устройство "What U hear" ("То, что ты слышишь"). Самое приятное, что при записи через это устройство сигнал не подвергается цифро-аналоговому и аналогово-цифровому преобразованиям, что исключает влияние наводок и вообще появление каких либо помех, связанных с аналоговым соединением. Таким образом, использование этого устройства записи как нельзя лучше подходит для осуществления перехвата цифровых аудио потоков, в том числе, потоков от программных MIDI-синтезаторов. Для владельцев звуковых плат, отличных от SB Live!, можно порекомендовать воспользоваться, например, такой программой, как Total Recorder. Идея программы аналогична идее устройства "What U Hear" в SB Live!. Эта программа создает в списке устройств для воспроизведения новое виртуальное устройство "Playback through Total Recorder", а также имеет собственную программу записи. Для осуществления преобразования необходимо выбрать это виртуальное устройство как устройство "по умолчанию" для воспроизведения аудио (в Sounds and Multimedia в контрольной панели Windows), запустить программу записи Total Recorder и включить воспроизведение необходимого .MID-файла. Вся прелесть такого способа заключается в том, что сигнал вообще не попадает в аналоговый тракт звуковой карты. Вообще говоря, сигнал даже не попадает на звуковую карту - Total Recorder перехватывает поток идущий на виртуальное устройство "Playback through Total Recorder" и записывает его в файл. Таким образом, с помощью Total Recorder можно произвести оцифровку MIDI-файла абсолютно без потерь качества.

Вариант третий. Как можно заметить, для осуществления оцифровки в предыдущих способах мы предусматривали наличие синтезатора (аппаратного или программного) и звуковой карты. Однако существуют программы специально предназначенные для перевода MIDI в .WAV. Фактически такая программа представляет собой программный MIDI-синтезатор, который подает синтезируемую информацию не на выход звуковой карты, а прямо в файл. Одна из таких программ называется WAVMaker. При использовании для преобразования такой программы наличие какой-либо звуковой аппаратуры теоретически не является необходимостью.

Таким образом, из всех перечисленных методов наиболее подходящий выбирается в зависимости от стоящей задачи. Если преобразование MIDI - .WAV необходимо осуществить максимально качественно, то следует либо воспользоваться цифровым подключением аппаратуры, либо попытаться осуществить преобразование программным путем, не затрагивающим аналоговую часть аппаратуры. Если же требования к качеству преобразования не столь высоки, то можно воспользоваться одним из способов, реализующих конвертирование с помощью аналогового соединения.

Какой метод сравнения двух аудио сигналов можно признать наиболее точным?

Сначала договоримся, что речь идет о сравнении двух сложных непериодических сигналов, представленных в цифровом виде. Далее все зависит от стоящей перед экспериментатором задачи. Вероятно, все сводится к двум вариантам: физическое сравнение двух сигналов (то есть сравнение точности совпадения форм сигналов) и субъективное сравнение, когда целью является оценка "похожести" звучания двух сигналов.

Первый вариант употребим больше при необходимости оценить, например, степень искаженности сигнала, прошедшего какую-либо обработку или передачу по цепям, вносящим помехи. В таком случае сравнение оригинального и искаженного сигналов можно производить, например, путем вычитания одного сигнала из другого (это возможно только в том случае, когда начало и протяженность сигналов во времени точно совпадают) - по результату (результирующему сигналу, полученному путем поотсчетного вычитания одного сигнала из другого) можно приблизительно оценить уровень потерянной информации (на слух либо проследив изменение спектрального состава сигнала). Также недавно автором одной из статей был предложен иной метод. Берутся два сравниваемых сигнала (в цифровом виде, естественно) и записываются не в абсолютном виде (то есть абсолютные значения амплитуд, PCM - ИКМ - импульсно-кодовая модуляция), а в виде относительного изменения значений амплитуд сигнала (как в ADPCM - АОИКМ - адаптивная относительная импульсно-кодовая модуляция). Другими словами, сигнал записывается значениями, характеризующими изменение значения каждого отсчета относительно предыдущего. Таким образом, в результате проделанной операции получаются, грубо говоря, данные об углах наклона амплитудной огибающей в каждой точке или, что то же самое, информация о виде (форме) сигнала. После такой обработки проводится вычитание одного сигнала из другого (оригинального) и усреднение значении амплитуды полученной разницы. По усредненной величине амплитуды можно судить о потерях, которые сопутствовали сжатию сигнала.

Второй вариант, целью которого является субъективное сравнение разницы в звучании двух сигналов, очень часто применим при оценке качества алгоритмов компрессии аудио. Вообще, целью большинства аудио кодеков (за исключением специализированных, например, вокодеров, кодеков для передачи ограниченного спектра частот и lossless кодеков) является в максимально меньшем объеме данных сохранить аудио информацию как можно более приближенную по качеству к оригинальному звучанию. Другими словами, задача сводится к обеспечению субъективно сходного с оригиналом качества звучания и никак не объективного физического сходства форм (огибающих) оригинального и декодированного сжатого сигналов. В этом случае, применимость описанных выше методов сравнения может быть очень спорна, так как форма сигналов может совпадать очень слабо, а субъективное качество звучания оригинального и восстановленного сжатого сигналов при этом почти не изменится. Тогда для сравнения сигналов можно воспользоваться несколькими разновидностями спектрального анализа, каждый из которых, тем не менее, имеет массу недостатков.
Первый заключается в графическом сравнении результирующих АЧХ оригинального и восстановленного сжатого сигналов за какой-то промежуток времени. Под понятием "результирующая АЧХ" подразумевается график зафиксированных пиковых значений амплитуд частотных составляющих сигнала за некоторый промежуток времени. Таким образом, взяв два одинаковых промежутка сравниваемых сигналов и построив их результирующие АЧХ, по совпадению (не совпадению) графиков АЧХ можно приблизительно оценить уровень потерянных частотных составляющих в сжатом сигнале, а также увидеть полосы частот, где эти потери наиболее выражены. Однако этот метод является статичным, то есть он абсолютно не учитывает изменение сигналов в динамике, что является очень важным, так как часто встречаются случаи, когда результирующие АЧХ сигналов почти совпадают, однако звучание сравниваемых промежутков сигналов отличается коренным образом даже на слух.
Вторая разновидность спектрального анализа - сравнение сонограмм сигналов (сонограмма - это диаграмма, на которой по оси абсцисс откладывается время, по оси ординат - частота, а амплитуда соответствующей частотной составляющей отмечается интенсивностью цвета в данной точке графика). Сонограмма является более информативной характеристикой, так как позволяет учесть при сравнении изменение сигналов в динамике. Однако этот метод, в отличие от предыдущего, является "слишком графическим", то есть, если при сравнении статических АЧХ имеется возможность оценить "на глаз" разницу графиков, то в случае с сонограммами эта возможность затруднена, так как сравнивать приходится не кривые графиков, а интенсивность цветов на диаграммах. Есть и еще один немаловажный недостаток сонограмм - размытость сигнала во времени, то есть неточное совпадение (отставание либо опережение) спектральной картины с реальным спектральным составом сигнала в каждый конкретный момент времени. Такой феномен обусловлен принципом неопределенности сопутствующим использованию Быстрого Преобразования Фурье (БПФ): чем больше временнОе разрешение спектра, тем меньше спектральное разрешение, и наоборот. При построении сонограммы берутся относительно большие окна для БПФ (промежутки времени, в которых анализируется спектр) и именно это и обуславливает эффект размазывания сигнала. Конечно, появление этого эффекта можно в какой-то мере избежать применяя анализ с перекрывающимися окнами в несколько проходов, однако объем вычислений при этом крайне возрастет и достичь одновременно высоких спектрального и временного разрешений не удастся.
Третий метод представляет собой более конкретизированный предыдущий, он заключается в построении АЧХ для каждого сканируемого окна БПФ. Однако эта задача не лишена тех же проблем, что и предыдущий метод, и, кроме того, производить сравнение графически крайне неудобно, даже если представить всю обсчитанную спектральную картину сигнала в трехмерном виде.

Как разновидность методов сравнения аудио сигналов существует и еще один, принципиально отличный от предыдущих способ - метод тестирования на слух. Такой метод очень широко применяется при тестировании качества компрессии lossy аудио кодеров. Метод заключается в следующем (техника проведения тестирования может быть немного отличной от описываемой, однако смысл остается неизменным). Берется музыкальная композиция в двух вариантах: оригинал и сжатый сигнал. Пользователь внимательно слушает оригинальный сигнал один раз. Далее пользователь вслепую прослушивает в неизвестном ему порядке (либо с помощью ассистента, либо с помощью какой-то программы) N раз оригинальный сигнал и N раз сжатый. Во время каждого отдельного прослушивания пользователь старается определить слушает он оригинал или нет. Свою оценку он записывает. По окончании результаты его оценок сравнивают с действительностью: в каком числе из 2*N прослушиваний пользователь правильно определил звучание оригинального и сжатого сигнала. Если отношение числа правильных оценок к неправильным <= 1 - значит пользователь не в состоянии отличить оригинал от сжатого сигнала. Если же это отношение > 1, значит пользователь в состоянии с большей или меньшей достоверностью отличить оригинал от не оригинала. Точнее, достоверность тем выше, чем полученное соотношение оценок выше единицы. Конечно, вариаций такого способа тестирования может быть много, но основная идея остается неизменной (также см. обуждение "Что такое эффект пустышки?").

Очевидно, что идеального метода сравнения сигналов не существует. Поэтому в каждом конкретном случае пользуются наиболее подходящим по точности и удобству методом сравнения, руководствуясь только соображениями целесообразности.

Что такое стеганография?

Что такое стеганография?

Стеганография - способ сокрытия секретной информации. Cтеганография известна уже много лет, даже сотни и тысячи лет. Идея ее остается неизменной, модифицируются лишь способы и задачи. До недавнего времени постановка задачи описывалась на простом примере: двое заключенных Алиса и Боб хотят переписываться между собой. При этом они хотят избежать вмешательства в процесс переписки охранника Вилли. Описанная задача имеет некоторые допущения и модификации. Так, например, можно условиться, что Алиса и Боб могут разделать передаваемое сообщение при помощи условного знака. Однако при этом, охранник Вилли имеет право читать сообщение и модифицировать его. Очень забавно написано о стеганографии здесь: http://www.cesser6.ru/stegano.htm. Вот цитата:

Стеганография - метод, с помощью которого скрывают сам факт передачи сообщения, и такой метод известен:
Берете раба и наголо обриваете ему голову.
Пишете на голове раба свое сообщение.
Ждете, пока у раба не отрастет шевелюра (раба желательно не купать).
Посылаете раба к получателю сообщения.
Получатель наголо обривает голову раба и читает ваше сообщение.

// оказывается, этот способ действительно был применен тираном Гистием, находившимся в V в до н.э. под надзором царя Дария в Сузах //

Имеющие исключительно лысых рабов могут читать дальше. Современная стеганография работает с электронными документами:

Берется документ - сообщение, факт передачи которого необходимо скрыть ("волк").
Берется документ с невинным содержанием, передача которого не вызывает подозрений ("овечья шкура").
Первый документ шифруется и некоторым образом вставляется во второй так, что внешне второй документ практически не меняется ("волк надевает овечью шкуру").
Второй документ отсылается в электронном виде получателю.
Получатель некоторым образом извлекает из полученного невинного документа истинное сообщение, расшифровывает его и читает ("волк снимает овечью шкуру").

Все это дает целых три рубежа защиты от любопытных глаз:
Первый рубеж - ваша переписка не вызывает подозрений в ее истинном содержании.
Если же такие подозрения возникли по каким-то иным причинам, то обладатель любопытных глаз должен еще найти способ, с помощью которого настоящее сообщение извлекается из мнимого.
Если такой способ все же найден - перед любопытными глазами зашифрованный документ, ключ к которому знаете вы и получатель.

Думаю, смысл стеганографии вам стал ясен. В 1996 году была выработана точная терминология и схемы, описывающие основные задачи стеганографии.
Итак, стеганографическая система - это совокупность средств и методов, которые используются для формирования скрытого канала передачи информации. Основная задача - создать такую стеганосистему (стегосистему), которая не позволит никому (кроме получателя и отправителя) извлечь и расшифровать данные из скрытого канала передачи. При этом создаваемая стеганосистема должна должна обладать следующим свойством: даже если противник сможет получить точное представление о структуре стеганосистемы, то в таком случае препятствием на пути противника к расшифровке данных должен стать ключ (открытый или закрытый), с помощью которого зашифрованы передаваемые данные. В идеале же, противник даже не должен догадываться о наличии в информации скрытого канала данных. Таким образом, можно говорить о "контейнере" и о "сообщении". "Контейнер" - любая информация, предназначенная для сокрытия в ней тайных данных (в качестве контейнера может выступать любая подходящая по структуре информация, например, графическая, звуковая или исполняемый машинный код). В то же время "сообщение" - есть передаваемые тайные данные, которые также могут иметь любую структуру. "Пустой контейнер" - контейнер, не содержащий тайных данных, "заполненный контейнер" или "стегоконтейнер" - контейнер, несущий в себе стего (сообщение). "Стегоканал" - часть стегоконтейнера предназначенная для переноса стего. Одной из наиболее трудных задач стеганографии является создание стегосистемы, устойчивой к модификациям (даже умышленным). Очевидно, что сокрытие достаточно объемных стегоданных накладывает очень жесткие ограничения на стегоконтейнер.

Можно различать три способа встраивания стегоканала в контейнер и организации контейнера: деструктивный, не деструктивный и конструирующая. Деструктивный способ подразумевает малозаметное, но все же искажение оригинальных данных, использующихся в качестве контейнера (например, встраивание стего в аудио файл может вызвать незаметные на слух искажения оригинального звучания). Не деструктивный способ подразумевает сокрытие стегоканала в стегоконтейнере таким образом, чтобы целостность данных, использующихся в качестве стегоконтейнера. не была нарушена (например, дописывание данных к концу файла, либо использование особенностей структуры контейнера с тем, чтобы внести в него дополнительные данные, не нарушая при этом оригинальных). Конструирующий способ подразумевает создание для транспортировки стего фиктивного контейнера, не несущего осмысленные данные (например, встраивание тайных данных в фиктивный графический файл, специально сгенерированный для этой цели); иными словами, контейнер создается "для отвода глаз".

В качестве контейнера может выступать как непрерывный поток данных, так и ограниченный в объеме. Во втором случае (когда в качестве контейнера используется, например, файл определенной структуры), стегосистема может опираться на известный фиксированный размер контейнера, а также на особенности его структуры. В потоковом контейнере основной проблемой является невозможность определения получателем "начала" и "конца" стего, что накладывает множество требований на организацию передатчика. С другой стороны, использование потокового контейнера избавляет передатчик от трудностей, связанных с ограниченностью объема контейнера фиксированной длины.

Существуют три различных типа приложения стеганографии: сокрытие данных, маркировка "водяными знаками" (watermarks) и нанесение пометок (заголовков). Маркировка водяными знаками применяется для сокрытия в данных информации о правах и идентификаторов авторства. Подобная маркировка должна жестко выполнять следующие требования: скрытые данные (водяные знаки) должны не вносить хоть сколько-нибудь заметные изменения в оригинальные данные и при этом быть очень устойчивыми к модификации последних. Водяные знаки имеют незначительный объем в сравнении с объемом оригинальных данных. Нанесение пометок - это, можно сказать, облегченная разновидность водяных знаков. Пометки используются для хранения индивидуальной информации, кроме того, пометки не обязаны так жестко отвечать требованиям устойчивости.

Дополнительную информацию о стеганографии можно почитать, например, здесь: http://privacy.yo.lv/stegano.htm, http://abc.nn.ru/secure/stega/.

Как оцифровать материалы со множества аудио кассет и отреставрировать.

Задача: оцифровать материалы со множества аудио кассет и отреставрировать. Как?

Для решения поставленной задачи нужно серьёзно подготовиться. Начните с магнитофона. При помощи цифровой обработки многое можно, но далеко не всё. Чем лучше сигнал, который вы оцифровываете, тем потом легче и тем лучше результаты. Оцифровывать, конечно же, следует с линейного выхода. Это первое. Далее, если уж браться за такую работу, то нужно чтобы головка магнитофона была в хорошем состоянии. "Запиленная" головка может испортить все дело. Каналы будут воспроизводиться не с одинаковым качеством (как правило, левый будет хуже), ухудшится частотная характеристика и т. д. Будете вы ставить новую головку, либо рискнете воспользоваться старой - в любом случае головку желательно размагнитить перед началом работы (вместе с головой также желательно размагнитить и экран внутри самой кассеты - для этого кассету нужно аккуратно разобрать). Итак, предположим, что качество воспроизведения вас устраивает. Не спешите включать запись (оцифровку). Очень желательно, чтобы у вас был коммутационный предусилитель с возможностью переключения выхода на моно. Включаете воспроизведение и переключаете выход со стерео на моно и обратно, слушая при этом звук (лучше всего в наушниках). Если запись соответствует положению зазора головки, то при включении моно режима характер звука никак не меняется, разумеется, за исключением того, что он становится монофоническим. Если же вы слышите, что в области верхних частот появляются неприятные эффекты, то положение головки нужно отрегулировать. Необходимо маленькой размагниченной отверткой поворачивать регулировочный винт возле головки, слушая при этом звук. Регулировка довольно "острая". Добейтесь максимально хорошего воспроизедения верхних частот. В идеале, при переключении режимов с моно на стерео и обратно характер звука никак не должен изменяться (за исключением стерео<->моно). Если же вы слышите флуктуации в моно режиме на верхних частотах, то дело хуже - это значит, что либо при записи, либо при воспроизведении лента при движении испытывала вертикальные колебания в районе зазора головки, что приводит к переменному сдвигу фаз. Если это произошло при записи, то сделать уже ничего нельзя. Если при воспроизведении, то теоретически можно, - проблема заключается лишь в трудности настройки механики магнитофона. Без переключения в моно режим эти настройки сделать нельзя. Тогда нужна специальная аппаратура. Если описанная настройка не произведена и зазор головки перекошен относительно записи, то ухудшается частотная характеристика сигнала, так как при этом фактически увеличивается эффетивная ширина зазора. Кроме этого, появляется очень существенный на высоких частотах фазовый сдвиг между каналами. Проверять положение головки следует для каждой стороны кассеты. Настройка положения зазора головки весьма проста. После небольшой практики (возьмите какую-нибудь музыкальную кассету) вы сможете сделать это за пару минут.

Если при воспроизведении с кассеты в режиме моно слышны флуктуации на высоких частотах и избавиться от них не удается, то следует оставить головку в том положении, в котором качество звука наилучшее; при сжатии оцифрованного с нее материала не следует пользоваться режимом Joint Stereo - в этом режиме для сжатия формируется разностный сигнал и после сжатия вы будете слышать эффекты, подобные тем, которые слышны в моно режиме.

Если у вас нет предварительного усилителя с коммутационными возможностями - это не беда. Его можно заменить программно, с помощью компьютера. Вот один из вариантов. По всей вероятности, у вас есть проигрыватель Winamp. Скачайте line-in plugin к нему (http://home.hccnet.nl/th.v.d.gronde/). Там же есть и документация. После установки сделайте следующее. Запустите микшер записи и выберите Line-in, установите желаемый уровень (пока он вас ни к чему не обязывает).

Запустите Winamp, нажмите Ctrl+L. В открывшемся окне введите line://nch=2,bps=16,srate=44100. Нажмите Ok. Снова вызовите это окно и введите line://nch=1,bps=16,srate=44100, нажмите Ok. Здесь: nch - number of channels, bps - bits per sample, srate - sample rate. Таким образом, активация 1-й строки даст вам стерео звук, а второй - моно. Если теперь вы подключите магнитофон к линейному входу, включите на нем воспроизведение и нажмете "play" на панели управления Winamp'а, то услышите звук соответствующий активной строке в play list'е. При переходе на другую строку (кнопки "Next Track" и "Previous Track" на панели управления Winamp) звук тут же поменяется. Возьмите какую-нибудь кассету для экспериментов. Запустите программу для записи, например, в Sound Forge. Включите воспроизведение и установите уровень записи так, чтобы максимум находился между -3 и -2db. Остановите воспроизведение. Вероятно, вы сможете найти кассету, из которой можно вытащить ленту. Оставьте в корпусе только пермаллоевую пластинку. Она нужна для экранирования головки. Без нее сильно возрастает фон. Вставьте этот пустой корпус в магнитофон и включите воспроизведение. По индикатору уровня вы можете видеть суммарную величину всего, что дает усилитель воспроизведения магнитофона, а в наушниках можете услышать характер этого звука. В зависимости от конструкции магнитофона уровень помех может зависеть от скорости вращения приемного узла (при отсутствии ленты он вращается с максимально возможной скоростью).
Можете придержать его рукой, чтобы определить, имеет ли это место. Ваша задача сделать уровень помех (в основном фона) минимальным. Он может зависеть от взаимной ориентации магнитофона и компьютера, от положения соединительного кабеля (особенно, если он низкого качества) и т. д. Если уровень фона чрезмерный, то в последствии при шумопонижении придется либо жертвовать нижней частью диапазона, либо оставлять какой-то фон.

Предположим, что регулировка окончена и запись сделана. Что дальше?
Запись с микрофона на магнитную ленту не характеризуется наличием большого количества щелчков (импульсных помех), которые характерны, например, для виниловой пластинки. Если же на вашей записи имеются щелчки, то разумно попытаться сразу от них избавиться. Для того, чтобы ясно понять причину этого, нужно привлечь теорию сигналов и соответствующую математику. Однако, попытаемся прояснить ситуацию, не прибегая к сложным выкладкам. Проделайте следующий опыт (для этого вам понадобится Sound Forge и Sonic Foundry Noise Reducnion DX Plugin, лучше 2-й версии). Вам потребуется буквально пара минут, но это многое прояснит. Запустите SF, создайте новый файл (File->New) с параметрами 44.1 кгц и 16 бит. Затем - Process->Insert Silence. Длительность задайте 10 сек. Установите линию-курсор примерно посередине файла и установите масштаб так, чтобы видеть отдельные точки-сэмплы. Инструментом "карандаш" поднимите до конца 8 точек в левом канале. Измените теперь масштаб так, чтобы можно было отметить участок с нарисованным импульсом длительностью примерно 1/2 секунды (отмечайте оба канала). Отметьте такой участок и выберите Noise Reduction из списка. Включите его для создания образца шума. График, который вы увидите, может слегка удивить, но именно таким он и должен быть. Выберите теперь все 10 сек. и опять создайте образец шума. Посмотрите, как поменялся график и попытайтесь объяснить, почему так произошло. В непосредственной близости от этого импулься нарисуйте импульс в правом канале, но поднимите уже 30 точек. Снова создайте образец шума и посмотрите график. Любопытно, не правда ли? Ну и, наконец, нарисуйте в любом канале импульс, поднимая 2 точки и посмотрите еще и этот график. Теперь подытожим. Из теории известно, что импульсный сигнал имеет широкий спектр, который зависит от его формы и длительности. Если в участке звука, который вы хотите использовать для создания образца шума, присутствуют импульсные помехи, то это сильно отразится на полученном спектре и полученный образец может мало соответствовать тому, что нужно. Кроме этого, как показывают графики, иногда полезно снижать уровень шума отдельно в каналах. Именно из-за этого обычно (не вдаваясь в подробности) рекомендуют сначала избавиться от импульсных помех. Можно, разумеется, поступать и иначе, но тогда требуется хорошее понимание процессов обработки сигнала.

После удаления импульсных помех следует взяться за шум. Для образца шума выберите сигнал стертой ленты с нулевым уровнем записи. Это, правда, может оказаться затруднительным, Все зависит от того, как включалась запись и какой использовался магнитофон - с АРУЗ или без него. Если в начале ленты такого участка нет, то придется поискать удобное место по файлу. Убрав шум ленты, вы получите примерно то, что вы записывали. Разумеется, есть еще много тонкостей, но мы их здесь опустим. SF дает очень хорошие результаты, так что упомянем здесь рекомендации именно для него. Не вырезайте сразу много шума (в db). Обычно на зашумленных записях работа в несколько проходов дает лучшие результаты. Понятно, что для каждого следующего прохода требуется новый образец шума и новые настройки. Начните децибел с 10-ти. Краткие описания настроек. Reduce noise by - задает, на сколько уменьшить уровень шума. Noise bias - смещение шума по уровню относительно сигнала. Если на закладке Noiseprint вы будете нажимать на маленькие кнопки, расположенные внизу с левой стороны, то увидите, что весь график смещается по вертикали в ту или иную стороны. Если спектральная составляющая превосходит по уровню соответствующую точку на графике, то, грубо говоря, она не считается шумом. Модификации алгоритмов - mode. Они все используют заданный образец, шума. Больше всего шума вырезается в Mode1. Дело, однако, не только в количестве шума. Лучше всего можно услышать разницу между модификациями снижая шум на тихом зашумленном участке с легкими! ударами по тарелкам. В Mode1 сильно срезается послезвучие - тарелка неестественно быстро затихает. Эффект убывает с возрастанием номера. Attack и Release speed задают время срабатывания и отпускания. Подбираются на слух, чтобы свести к минимуму слышимость срабатывания шумопонижения. Во многих случаях установки по умолчанию работают неплохо. Сильное влияние на характер шумопонижения оказывает FFT Size. Верхняя часть звукового диапазона срезается меньше при уменьшении FFT Size, но могут появиться неприятные артефакты. Как всегда, нужен компромисс. Интересных результатов можно добиться работая с графиком. Вы можете задать частотный диапазон, в котором производить шумопонижение, изменить характер шумопонижения на разных участках и т. д.

Всё о звуке и звукорежиссуре