информационная безопасность
без паники и всерьез
 подробно о проектеRambler's Top100
Все любят медSpanning Tree Protocol: недокументированное применениеГде водятся OGRы
BugTraq.Ru
Русский BugTraq
 Анализ криптографических сетевых... 
 Модель надежности двухузлового... 
 Специальные марковские модели надежности... 
 Блокировка российских аккаунтов... 
 Отзыв сертификатов ЦБ РФ, ПСБ,... 
 Памятка мирным людям во время информационной... 
главная обзор RSN блог библиотека закон бред форум dnet о проекте
bugtraq.ru / форум / miscellaneous
Имя Пароль
ФОРУМ
все доски
FAQ
IRC
новые сообщения
site updates
guestbook
beginners
sysadmin
programming
operating systems
theory
web building
software
hardware
networking
law
hacking
gadgets
job
dnet
humor
miscellaneous
scrap
регистрация





Легенда:
  новое сообщение
  закрытая нитка
  новое сообщение
  в закрытой нитке
  старое сообщение
  • Напоминаю, что масса вопросов по функционированию форума снимается после прочтения его описания.
  • Новичкам также крайне полезно ознакомиться с данным документом.
Давайте в отличии от Узбекских программистов не будем... 16.01.08 11:59  Число просмотров: 1797
Автор: DPP <Dmitry P. Pimenov> Статус: The Elderman
Отредактировано 16.01.08 12:05  Количество правок: 5
<"чистая" ссылка>
Давайте в отличии от Узбекских программистов не будем браться сразу за операционку, а начнем с кодека и утрем нос Франгоферам. Есть некоторые идеи.
Для начала хочется заметить, когда зародился МРЗ формат, я долго недоумевал, почему он такой не слишком компактный что-ли, как должен быть. ЕМНИП любую функцию на интервале можно разложить в гармонический ряд с заданной точностью. Отцифрованную звукозвпись, длиной в секунду можно представить, как дисретную функцию, заданную таблично. В предположении того, что по частоте гармоник можно ограничится диапазоном 10Гц-100кГц, получается, что для достаточной точности должно хватить 15-16 гармоник. Для каждой надо амплитуду, частоту, фазу, декремент затухания, то есть 8-10 байт. Итого на секунду звука должно хватить ~128 байт на канал. Это же килобит в секунду, а не 256 килобит в секунду! Ну понятно, стерео, но тогда МРЗ "рыхлее" в 128 раз получается! Откуда?
Может в МРЗ какие-то другие алгоритмы используются для преобразования. Скорее всего. Разложение на гармоники и обратное восстановление звука должно не ухудшать качество звука, а наоборот улучшать его! Во первых шумы не имеют гармонических составляющих по определению, стало быть побочный положительный эффект - избавляемся от шумов!
К стати. В связи с тем, что в основном звук, который преобразуется в МРЗ представляет из себя музыку, голос либо смесь, то есть песню. Весь этот звук имеет гармоническую природу - колебательные движения излучателей (струны, голосовые связки) в упругой среде. Стало быть можно выделить чистые гармоники. Отсюда вытекает модифицированный алгоритм сжатия - не тупо раскладывать на кратные гармоники, а вычислять подходяшие. Поскольку таких компонент будет не 15-16, а несколько меньше, поскольку в одноголосом инструменте уже вторая гармоника подчастую составляет несколько процентов от первой, то достаточно хранить только те, что присутствуют. Стало быть коэффициент сжатия получится еще выше и секунда одного канала может сжаться до 64, 48 и даже 32 байт! Что-то я лишку махнул, даже самому не верится. Наверное все-таки ошибся где-то, только не пойму где.
А, еще чуть не забыл про побочный положительный эффект разложения не на полный ряд гармоник. Обычно при записи звук проходит умеренно сложный аналоговый тракт, где может потерпеть некоторые типичные нелинейные искажения, например "насыщение" (обрубание "сверху"), гистерезис и прочие. Так вот гармоническое преобразование отцифрованного звука может "вылечить" поврежденную подобными искажениями запись.
Кто сбацает кодек - не забудте про меня :-).
К чему я это написал. Вот читал я про новый Франгофер и в голову еще интересные мысли пришли относительно сжатия без потерь или с незначительными потерями, но с более высокой степенью, чем существующие. Ну скажем можно получить не двухкратное, а четырех- или даже восьмикратное сжатие таких "тяжелых" данных, как отцифрованый звук.
<miscellaneous> Поиск 






Rambler's Top100
Рейтинг@Mail.ru


  Copyright © 2001-2022 Dmitry Leonov   Page build time: 0 s   Design: Vadim Derkach