一种快速的特定音频指纹提取方法概要
发布时间:
— 211—
一种快速的特定音频指纹提取方法 张 敏 1,2,欧阳建权 1,2,李泽洲 1,2,刘 炜 1,2
(1. 湘潭大学智能计算与信息处理教育部重点实验室 ,湘潭 411105; 2. 湘潭大学
信息工程学院 ,湘潭 411105
摘 要 :针对当前音频哈希指纹方法不足以满足特定音频 ( 如广告 的实时监测问 题 ,提出一种快速的特定音频指纹提取方法 ,通过提取每 帧感知最相关的频域信息 ,将 其分为 33个频带,并提取相邻 2帧相邻频带的差异作为指纹值 ,每帧提 32个 0/1 值。实验表明 ,与现有方 法相比 ,该方法在保证音频检测准确性的同时 ,能实现指纹的 快速提取。 关键词:音频;指纹提取 ;音频哈希指纹法
Fast Fingerprint Extraction Method for Specific Audio ZHANG Min1,2, OUYANG Jian-quan1,2, LI Ze-zhou 1,2, LIU Wei1,2 (1. Key Laboratory of Intelligent Computing & Information Processing, Xiangtan University, Ministry of Education, Xiangtan 411105; 2. College of Information Engineering, Xiangtan University, Xiangtan 411105 【 Abstract 】
In view of the current audio hash fingerprinting method is not sufficient to meet the real-time monitoring for specific audio(e.g. advertising, this paper presents a fast fingerprint extraction method for specific audio. It extracts the information with the most relevant perception of each frame in frequency domain and divides the information into 33 bands. It extracts the differences between the equivalent bands from adjacent frames as the fingerprint. For each frame, 32 0/1 values are computed. Compared with existing method, this method ensures the accuracy of detection and extracts fingerprint rapidly at the same time. Key words】
audio; fingerprint extraction; audio hash fingerprinting method
计 算 机 工 程 Computer Engineering第 36卷 第 2期
Vol.36 No.2 2010年 1月
January 2010 ·多媒体技术及应用 ·文章编号 :1000— 3428(201002— 0211— 03 文献标识码 :A 中图分类号 :TP37
1 概述
随着互联网与数字媒体技术的发展 ,每年都将新增海量 的音频数据 ,人们能够更 加方便、快捷、经济地接触到数字 媒体 ,多媒体数据也已成为互联网信息高速公路 上传送数据 的主要部分。声音媒体是除视觉媒体外最重要的媒体 ,占总 信息量的 20%左右 [1] 。同时 ,大容量高速存储系统为声音的 海量存储提供了基本保障 ,各行业 对声音媒体的使用越来越 广泛。因此 ,如何从海量的声音信息中快速检索所需要的 信 息已经成了亟需解决的问题。
许多国家的广播电台必须为播放的音乐支付版税 , 因此, 版权所有者希望监测电 台播放 ,以确认所播放的音乐是否支 付版税。即使在电台可以免费播放音乐的国家 , 版权所有者 也有兴趣监测电台播放的统计数据。广告客户也希望监测电 台及电视 台的广告播出 ,以验证商业广告是否按商定的时段 和按量播出。同时 ,国家监管部门 也希望监测电台和电视台 是否播放违禁广告。其他应用还包括电台和电视台的节 目材 料统计分析和国家的法律实施强制播放监测等。然而 ,当今 媒体数据更新如此