摘要:本文详细讲述了如何利用DirectSound对经过声卡和麦克风的数据进行捕获,进行录音,并保存为wave格式的文件。
曾经学习过Directshow的开发,对于Dsound一直没有仔细的学习,以前只是知道Dsound是做音频开发的,我一直以为它和Dshow的结构体系差不多,经过仔细学习后,发现,其实他们完全两码事。DirectSound虽然也基于COM,但不象Dshow那样多个的filter组成链表。
闲话少说,下面我们看看DirectSound到底能帮我们做些什么。
1、播放WAVE格式的音频文件或者资源。
2、可以同时播放多个音频。
3、Assign high-priority sounds to hardware-controlled buffers
4、播放3D立体声音
5、在声音中添加特技效果,比如回声,动态的改变特技的参数等
6、将麦克风或者其他音频输入设备的声音录制成wave格式的文件
DirectSound就能做这么多事情,到这里,我都有点怀疑DirectSound是不是就是封装了mmio系列和wav系列的函数。因为这些底层的API也能够完成这些事情。这里我们主要讨论一下,如果使用Directsound进行录音,并保存成wave格式的文件。
在开始工作之前,要先介绍DirectSound录音用到的三个非常重要的对象:
·IDirectSoundCapture8 ,设备对象,根据你录音的设备创建的设备对象,利用该对象可以获取设备的属性。
·IDirectSoundCaptureBuffer8,缓冲区对象,该对象由设备对象创建,主要用来操作音频数据
·IDirectSoundNotify8 ,事件通知对象,该对象用来通知应用程序从缓冲区中将数据取走,写入文件保存起来。
利用DirectSound录音的主要思路,就是先根据选择的录音设备创建设备对象,然后通过设备对象创建辅助缓冲区对象,开始录音的时候,设备将数据写入缓冲区,应用程序主动的从缓冲区将数据读出来写文件即可,就实现了录音功能。这里简单介绍一下dsound的通知功能,应用程序会创建一个通知对象,然后将通知对象邦定,然后设定通知位置(position),什么是通知位置呢,比如缓冲区的大小为4000字节,如果你想当数据达到缓冲区一半的时候能得到通知开始copy数据,那么此时你就可以将通知位置设定为2000,通知位置可以任意的设定,当缓冲区的数据达到你设定的位置时,就会通知应用程序将缓冲区的数据copy到文件中,缓冲区是循环利用的,当缓冲区填充满了以后,就会从头开始充填数据,所以,缓冲区就是一边读,一边写的过程。
下面我讲一下录音的主要步骤,可以使大家的思路更清晰一些
1、枚举录音的设备
2、根据选择的设备创建设备对象
3、利用设备对象创建缓冲区对象
4、设置通知机制
5、创建工作线程,用来将缓冲区的数据写入文件。
先来定义一下用到的数据
LPDIRECTSOUNDCAPTURE8 g_pDSCapture = NULL;//设备对象指针 LPDIRECTSOUNDCAPTUREBUFFER g_pDSBCapture = NULL;//缓冲区对象指针 LPDIRECTSOUNDNOTIFY8 g_pDSNotify = NULL;//用来设置通知的对象接口
GUID g_guidCaptureDevice = GUID_NULL; //设备id BOOL g_bRecording = FALSE; //是否正在录音 WAVEFORMATEX g_wfxInput; //输入的音频格式
DSBPOSITIONNOTIFY g_aPosNotify[ NUM_REC_NOTIFICATIONS + 1 ]; //设置通知标志的数组 HANDLE g_hNotificationEvent; //通知事件 BOOL g_abInputFormatSupported[20]; DWORD g_dwCaptureBufferSize; //录音用缓冲区的大小 DWORD g_dwNextCaptureOffset;//偏移位置 DWORD g_dwNotifySize;// 通知位置 CWaveFile* g_pWaveFile;// |
枚举录音的设备 如果你的程序只是想从用户缺省的设备上进行声音的录制,那么就没有必要来枚举出系统中的所有录音的设备,当你调用DirectSoundCaptureCreate8 或者另外一个函数DirectSoundFullDuplexCreate8的时候,其实就默认指定了一个缺省的录音设备。
当然,在下面的情况下,你就必须要枚举系统中所有的设备,例如,你的应用程序并不支持所有的输出设备,或者你的应用程需要两个或者多个设备,或者你希望用户自己来选择输出设备。
枚举设备,你首先要定义一个回调函数,这个回调函数可以被系统中的每个设备来调用,你可以在各函数做任何事情,这个函数的命名也没有任何的限制,但是函数应该以DSEnumCallback为原型,如果枚举没有结束,这个回调函数就返回TRUE,如果枚举结束,例如你找到合适的设备,这个函数就要返回FALSE。
下面是回调函数的一个例子,这个函数将枚举的每一个设备都添加到一个combox中,将设备的GUID保存到一个item 中,这个函数的前三个参数由设备的驱动程序提供,第四个参数有DirectSoundCaptureEnumerate函数提供,这个参数可以是任意的32位值,这个例子里是combox的句柄,
BOOL CALLBACK DSEnumProc(LPGUID lpGUID, LPCTSTR lpszDesc, LPCTSTR lpszDrvName, LPVOID lpContext ) { HWND hCombo = (HWND)lpContext; LPGUID lpTemp = NULL;
if (lpGUID != NULL) // NULL only for "Primary Sound Driver". { if ((lpTemp = (LPGUID)malloc(sizeof(GUID))) == NULL) { return(TRUE); } memcpy(lpTemp, lpGUID, sizeof(GUID)); } //下面的代码主要主要是将设备添加到CComboBox,其实你完全直接将CComboBox指针传递过来,直接的添加,这里采用的是给combox窗口发送消息的方法, ComboBox_AddString(hCombo, lpszDesc); ComboBox_SetItemData(hCombo, ComboBox_FindString(hCombo, 0, lpszDesc), lpTemp ); free(lpTemp); return(TRUE); } |
枚举设备通常都是在对话框初始化的时候才进行的,我们假设hCombo就是combox句柄,hDlg就对话框的句柄,看看我们怎么来枚举设备的吧。
if (FAILED(DirectSoundCaptureEnumerate ((LPDSENUMCALLBACK)DSEnumProc, (VOID*)&hCombo))) { EndDialog(hDlg, TRUE); return(TRUE); } |
在这个例子中,combox的句柄作为参数传递到DirectSoundEnumerate函数中,然后又被传递到回调函数中,这个参数你可以是你想传递的任意的32位值。
注:第一个被枚举的设备通常称为Primary sound driver,并且回调函数的lpGUID为NULL,这个设备就是用户通过控制面板设置的缺省的录音声音设备。