HTML

hang

2008.10.19. 22:50 Zimankó

 

 

Hangazonosítás

témakörében készített referátum

 

 

 

 

 

 

 

 

 

 

 

 

Készítette: Horváth Dóra

HODPAAA.PTE

2. szemeszteres hallgató

 

 

 

 

A Hangazonosítás c. szemináriumon megismerkedtem a kriminológia egy új ágával, az igazságügyi hangazonosítással. Érdeklődni kezdtem a hangazonosítás technikai oldaláról, a hang fizikai tulajdonságairól és milyenségéről.

Munkámban általános összefoglalót kívánok nyújtani a fenti témákkal kapcsolatban.

 

 

 

Mi is az a hangazonosítás?

 

Az emberi beszédhang vizsgálata, összehasonlítása nemcsak a bűnügyi gyakorlatban, hanem a mindennapokban is megjelenik, hála a technika vívmányainak. Egyre többen kerülünk kapcsolatba olyan hangazonosító rendszerekkel, melyek egy tárolt hangminta segítségével azonosítják a beszélőt.

Külföldön egyre gyakoribbak az ilyen szisztéma szerint működő beléptető rendszerek, biztonsági kapuk. Az így felvett hang optimális minőségű, a személyek tudtával és közreműködésével készül, az ő céljaikat szolgálja. Így a természetes hangjukon beszélnek, és az azonosítás könnyen működik. A beszédhangot azonban könnyen befolyásolja egy megfázás, légúti fertőzés, vagy fogászati beavatkozás, így ez a rendszer nem tökéletes.

Mi magunk is kerülhettünk már kapcsolatba hangazonosító rendszerrel, ha nem is voltunk ennek tudatában. A legtöbb mobiltelefonon ugyanis, amelyek hangrögzítővel rendelkeznek, megadhatunk rövid hangparancsokat, így könnyítve a telefon kezelését. Ez a rendszer a fent említetthez nagyon hasonló, egy rögzített hangminta segítségével történik a hangparancs azonosítása.

 

 

Igazságügyi hangazonosítás

 

Az igazságügyi területen végzett hangazonosítás ennél sokkal összetettebb és bonyolultabb. A bűnügyben keletkezett hangfelvétel természetesen nem összehasonlítás végett készült. A minta rögzítésekor ugyanis a gyanúsított gyakran manipulálja a hangját, megnehezítve a nyomozást. Problémát jelent a felvétel alapzaja is (pl. telefonvonal vagy hangrögzítő rendszer hibái), ezen bizonyos mértékig lehet javítani.

Az összehasonlító vizsgálat spektografikus (hangszínkép-elemzéses) módszeren alapszik. Matematikai vizsgálatokat végeznek (FFT, FFTW, CEPSTRUM, SPECTOGRAM, LCP, LCPW analízis).

Alapvető kérdés, hogy a spektrális vizsgálat során felfedezett hasonlóságok milyen mértékű azonosságot mutatnak. A hangazonosság valószínűsége nem egyenlő a személyazonosság valószínűségével. Probléma lehet az időfaktor is, hiszen hangunk az életkor előrehaladtával változik. A beszédhang alapján viszont következtethetünk a beszélő korára, megjelenésére, fizikumára, nemére, sokszor társadalmi hovatartozására is.

 

 

 

A képen fent a hangjel, alul párhuzamosan a spektogram látható.

 

 

 

A "Kukac felmászott a fára" mondat spektrogramja.
Jól látható a mássalhangzók aperiodikus szerkezete és a magánhangzók periodikus struktúrája.

 

A hangfelvétel manipulálása

 

Editálásnak vagy montírozásnak nevezzünk azt, hogy hang editor rendszer segítségével a felvételből részeket emelünk ki, vagy vágunk bele, így megváltoztatva annak értelmét.

A hangfelvételt kétféleképpen lehet manipulálni: fizikai úton (pl. hangszalag vágása) és digitális úton (számítógépes rendszer segítségével).

A fizikai úton befolyásolt felvételt könnyű feltárni, sokszor laikus számára is egyértelmű a manipulálás. A vizsgálatok során a feltételezett vágási pontokból szoktak kiindulni. Elsősorban zajugrásokat, akusztikai elemek változását keresik. Minél hosszabb az ilyen felvétel, annál nagyobb az esély a lelepleződésre.

 

 

Hangutánzás

 

Az emberi beszédhang utánzásának kérdésköre igen érdekes. Sok hazai és külföldi komikus próbálkozott már meg mások hangjának, hangszínének imitálásával. Titka elsősorban az egyedi stílusjegyek átvételében rejlik. Különleges, egyedi beszédstílusú embereket sokkal könnyebb utánozni.

Mivel hangképzésünk elemei, jellemzői igen kötöttek, így csak kis mértékben tudunk változtatni azokon. Spektrális összehasonlító elemzéskor a legjobb hangutánzásra is fény derül. Viszont rövid, esetleg sérült hangfelvétel vizsgálatakor nem biztos, hogy ilyen egyértelműen fel lehet fedni a csalást.

Más a helyzet, ha azonos nemű testvérekről vagy egypetéjű ikerpárról van szó. Az ő esetükben a hangminták összehasonlítása problémát jelenthet, hangképzésük nagyfokú hasonlósága miatt. Ilyen esetekben, mint a gyakorlat is mutatja, sokszor nem lehet megállapítani a különbséget.

 

Mesterséges beszédhang

 

Az emberi beszédhang mesterséges előállítására számos kísérlet történt – mindeddig eredménytelenül. A beszéd hangzóiból mintát véve - azokat variálva -, ugyan létre lehet hozni érthető szöveget, de ez a szöveg mentes lesz az emberi beszédre jellemző hangsúlyoktól, stílusjegyektől. Monoton, gépi hang jön létre ilyen módon. Az ilyen szintetikus szövegről a laikus is könnyen megállapíthatja a manipulációt. (Ilyen szöveg pl. a pontos idő felhívásakor hallott hang.)

 

 

A digitális hangrekonstrukció

 

A digitális technológia új megközelítést igényel. Az igazságszolgáltatásban vizsgált analóg felvételeket előbb digitalizálni kell. A digitalizált jel jellemző paraméterei a mintavételi frekvencia és a felbontás. A CD audio szabvány 44,1 kHz mintavételi frekvenciát és 16 bit felbontást határoz meg. A mintavételi tétel alapján a mintavételi frekvenciának nagyobbnak kell lennie, mint a mintavett jel sávszélességének - a jel legnagyobb frekvenciájú összetevőjének - a kétszerese. Vagyis pl. egy 22 kHz-es hangjelállomány a 44,1 kHz-es mintavételi frekvenciával még átvihető.

A kriminalisztikában szereplő hangfelvételek sávszélessége igen kicsi, 3-5 kHz-es. Ez ugyan alulmarad a CD szabvány maximális átviteli értékétől, azonban sokkal jobb hangrekonstrukció érhető el, ha a mintavételi frekvenciát az analóg felvétel sávszélességének kétszeresénél jóval nagyobbra állítjuk. A hangfelvételi zavarok, hibák sokkal jobban elkülönülnek a hasznos információktól, könnyebben feldolgozhatók lesznek.

A szélessávú zajszűrés összetett feladat, a felhasználó hallása, érzéke és szaktudása döntő jelentőségű.

 

 


Az ábrán fent az eredeti, alatta a zajszűrt és zavarmentesített felvétel részlete.

 

 

A sikeres zajszűrés az analízis minőgégén, illetve a zajszűrés beállításainak paraméterein múlik. A helyreállított, alacsonyabb zajszintű felvételen a beszédérthetőség lényegesen jobb.

A szakértői rekonstrukció során a legfontosabb a zajcsökkentés mértékének meghatározása. A zaj csökkentésének mértékével ugyanis, egy bizonyos idő után, a hasznos jelek is torzulni fognak. A torzulás elfogadható, ha a rekonstrukció célja az volt, hogy a beszéd minél érthetőbb legyen, és nem számít, hogy a beszélő természetes hangja már-már gépi hanggá torzul.

Vegyük például azt az esetet, hogy a hatóság relatíve nagy távolságból képi- és hangfelvételeket készít, egy bizonyos esemény rögzítésére. Ha a képen felismerhetők a célszemélyek, akkor a hangfelvétel célja nem a beszélők azonosítása lesz, hanem az, hogy minél érthetőbb legyen a felvétel. Ilyenkor a beszéd ugyan érthetővé válik, de a digitális helyreállítás után nem lesz alkalmas a beszélők azonosítására.

Szólj hozzá!

hangazonosítás

2008.10.19. 22:49 Zimankó

17. megállapítás levél a V-Worldwide-tól a az LVA eredményekre vonatkozólag.

Köszönet a lehetőségért, hogy részt vehetünk a kutatásodnak ebben a fázisában. Üdvözöljük a Rétegelt Hang Analízis technológia zord értékelését, azért fáradoztunk veled és a csapatoddal, hogy kifejlesszük a teljes és tökéletes megértését az LVA képességeinek. Megvitattunk veled néhány aggodalmat, elhiszük neked, megértünk és elismerjük az adatgyűjtés bizonyos nézőpontjait, és, hogy ez hogyan van hatással a képességre, hogy gondoskodjanak az adatok jelentőségteljes elemzéséről. Megértjük ezt azoknak az aggodalmaknak az ellenére, hogy szeretnéd, hogy tovább részt vegyünk a meghatározásában akár akarjuk akár nem a jelentőségteljes eredmények szerzésében a rendelkezésre álló adatokból. Értjük, hogy a kutatás e fázisának milyen lehetséges eredményei lehetnek, és arra kell használni azt, amit megtanultunk, hogy létrehozzunk jobb adatgyűjtési protokollokat, és az adatgyűjtés átalakítsuk. Azokat a különös adatgyűjtési aggodalmakat, amiket veled megvitattunk lejjebb összefoglaltuk:

1.    A kérdéseket gyorsan kérdezik és egy sorban.

2.    A beszélőket arra kell kérni, hogy teljes mondatban válaszoljanak.

3.    A beszélő sokkal korlátozottabb volta a válaszaiban, és nem beszélt szabadon, amit az LVA sokkal jobban szeret. Az LVA beszédes, és a gondolatok szabad áramlásában, és az interaktív válaszokban él. A válaszokból következő formátumok, néha túlságosan is mechanikusak voltak a természeteshez képest.

4.    Mert a beszélő tudta, hogy neki, vagy neki nem volt igazi felelősségre vonhatósága azzal kapcsolatban, amit mondott, a beszélőtől nem követelték meg, a szándékot, ami elengedhetetlen, hogy megvalósítja maradéktalanul a kijelentésbe ütközést.

5.    Van egy adatgyűjtéssel való időzítési kapcsolat. Van a beszélők idő sorozatában felelősségre vonhatóság? A beszélőknek van idejük arra, hogy kidolgozzák a válaszaikat, és tud alkalmazkodni az idővonal helyén?

 

A 17. megállapítás folytatása.

Nekünk szintén volt néhány műszaki ötletünk, hogy az adatot hogyan gyűjtötték és gyűjtötték össze. Mi azt tanácsoljuk neked, hogy soha ne változtasd meg a BG beállítást (hagyd úgy amilyennek azt az LVA kijelölte), ne használj váltáskeveréket és ne olvassz össze természetellenes szegmenseket és összpontosíts a szegmensekre, a világos válaszra (én nem). A szegmenseket neked kellene megtisztítani a tagolatlan zajoktól („ummms” ahhhs és csattanások), de legyél gondos és ne törölj túl sokat. Ráadásul a váltás+keverék gomb használatával egy magasabb feszültségi szintet alkalmaz összességében és sokkal több adatot tudhat meg a szegmensekre vonatkozóan. A protokoll miatt hogy hogyan és hol tették fel a kérdéseket, legyél gondos válaszonként, figyeld a poligráf válaszait. Mert a protokoll nem alkalmazható irányított kérdésekben, vagy hozd le a fickót kérdésekben, ott van néhány szokatlan phenomenons (sic), hogy azok DI-k, vagy nem igazi DI-k. Ez inkább feszültség és zavar, amelyet az alábbi tényezők okoznak, érzelmi reakciókkal párosuló út megkapása (SPT növekedése), ami a kognitív szintek csökkenésével támogatott (SPJ). Bár mi azért fáradozunk veled, hogy lásd, hogy szerezhetjük meg a már gyűjtött adatokból, mi azt ajánljuk, hogy az adatgyűjtésnél kövesd a következőket:

1. Dolgozz a fejlesztővel egy olyan elrendeződésű terven, ami learatja a szükséges információkat olyan mellékhatások nélkül, amiket létrehoztál.

2. Hozz létre egy csendesebb munkakörnyezetet.

3. Ne legyenek gyorsan ismétlődő válaszaid, amik pre-strukturáltak.

Várjuk azt, hogy tovább dolgozhassunk veled ezen a tanulmányon.

Szívélyes üdvözlettel,

C. David Watson

Vezető operációs tisztviselő

 

Érdekes módon az adatgyűjtés befejeztével, a kutatócsoport felfedezte az, hogy az LVA által kifejlesztett program jobban megfelelhet a kutatásnak. A „Gate Keeper” egy olyan program, amit arra terveztek, hogy megbecsülje a csalást az „igen” és „nem” válaszok rövid szériájában- épp, mint a protokoll, amit használtak ebben a projektben (lásd 18. megállapítás). A programot repülőtereken való használatra tervezték. Az nem világos, hogy a Gate Keeper technológia miért nem megfelelő a kutató csoportnak az LVA helyett (ha a program jobban megfelelne). A jövőbeli tesztek, amelyek használják ezt a protokollt meg kell fontolniuk a a Gate Keeper használatát az LVA helyett. A pillanatban távozó potenciális problémák, amik a hamis vallomásokkal voltak kapcsolatba hozva (Wylie, 2001), az eredményeink azt mutatják, hogy a VSA eszközök bizonyos feltételek alatt végződnek kevesebb megtévesztő válasszal. Végül megcímezzük a VSA használatának gyakorlatiasságát a rendőrségi interjú környezetén kívül.

 

18. megállapítás, VWorldwide Demonstráció, arra hogy tudják az LVA Technológiát adaptálni a Repülőtéri Biztonsági Szolgálatoknak (Gate Keeper).

Source: http://www.v-lva.com/newsite*/downloads/GK-1_Brochure.pdf (Accessed December 12,

 

Végül a tanulmányunk megmutatta, a VSA eszközök használatát a börtön környezetben, amik valószínűleg legutóbbi deviáns  viselkedéstől megtévesztőek (tiltott droghasználat), egy olyan helyzettel összehasonlítva, ahol az eredményeket egyszerűen tollal és papírral veszik fel. Ez a felfedezés burkolt célzás a társadalomtudósoknak és a jogalkalmazóknak. A társadalomtudósoknak ez hamis csővezeték hatás egy módszertanilag érdekes sidebar, ami becsületesebb válaszokra tudna bátorítani a témákból.

A törvényalkalmazók szempontjából a hamis csővezeték hatás bemutató eredményes, mert a törvényalkalmazó tisztviselők szerint a VSA eszközök sikeresek, mert ők képesek voltak egy ügyet megoldani, mert a gyanúsított bevallotta a bűncselekményt, amíg keresztülment a VSA interjún.

 Ahogy azokat a VSA programok teszteltük, jelenleg nem tiszta, hogy ezek a termékek hasznos-e egy, olyan környezetben, mint például a repülőtér. Kutatást vezettünk egy viszonylag csendes szobában, és még mindig problémáink voltak azzal, hogy olyan CVSA ábrákat szerezzünk, amik nem voltak túl hangosak, vagy alul moduláltak.

 LVA követelmény, hogy csalás nyomozást vezessenek be a szóbeli válaszoknál, szintén csináljanak kivihetetlen szoftvert reptéri környezetben történő használatra.

 Ráadásul, az LVA nagy mennyiségű interjú utáni munkát követel a válaszok felosztására. Ennek az eszköznek a használata (tesztelése) lehetetlen egy nyilvános környezetben, mint például a repülőtér.

 Termékek. A téves adatok, amiket összegyűjtött a tanulmány elérhetőek egy SPSS formátumban. A VSA adatok további tesztjei, vezethetik az adatok használatát, de az adatok szintén pótolják, azt a gyér mennyiségű adatot, amik rendelkezésre állnak jelenleg a VSA tanulmányokban.

 

A legnagyobb kihívás (a VSA kutatással van) az elégséges megtévesztő stressz adatok és az igazság terület elérhetetlenségével van. (Haddad, Ratley, Walter, and Smith, 2002:19).

 

 

A kutatók, akik érdekeltek a VSA tanulmányokban megkövetelik az audió adatok felfedezését, az igazságot (néhány ismertetőjel, amiből a kutató tudja, hogy a személy igazat mondott-e). Gyakran ez teszi azt, hogy, ha a rendőrség kérdez az általa szolgáltatott gyanúsítottak kihallgatásából származó hang szalagok, a személyűségük megállapítására, akik hazudtak és, akik elmondták az igazságot. Ebből adódik a használat erkölcse, ezek az adatok szintén hibásak, mert felvételek minőségének változatossága, és az információk változó mennyisége is megtalálható a szalagon. Ráadásul a rendőrség nem tudhatja ki a megtévesztő. Lehet, hogy egy válaszoló elmondja az igazságot később mégis elítélik. Lehet, hogy a válaszoló hazudik, mégsem ítélik el soha. Így használni ezeket az adatokat rendkívül megbízhatatlan. A kutatók szintén használták a SUSAS-t (beszéd alatt mutatott és tényleges stressz) ami irányítja a VSA kutatást, de ez nem az igazság területe, ami rendelkezésre áll ezekhez az adatokhoz (Hansen,1996). Másfelől az adatok, amiket gyűjtöttek ebben a tanulmányban elérhetőek, olyan kutatóknak, akik eszközöket szeretnének tesztelni (vagy más elméletek( „off-line” vagy „kapcsolat nélkül”). Az adatok audió csipeszeket nyújtanak (egy wav* fájlban) az igazság területével (megtévesztő vagy nem).

 

Óvások. A problémákon kívül, amiket felül megvitattuk érezzük a feljegyzés fontosságát, másik rövid eljövetelét tanulmányunknak. Az érvényességtanulmányunknak volt egy fő eleme például, a válaszolók legutóbbi droghasználattal kapcsolatos vizeletvizsgálatos tesztes kérdésre adott válaszainak összehasonlításával. Az feltevés természetesen, hogy a drog teszt a droghasználatot 100%-ig felfedi. Amíg mi tudjuk, hogy ez nem így van, addig a drog laborunk azt jelentette, hogy az ő pontosságuk aránya közel 100%-os, és adjuk meg bizalmunkat. Mondták, hogy mi aggódunk azoknak az embereknek a száma miatt, akik azt mondták, hogy használtak marihuánát az elmúlt 30 napban, de negatívan tesztelték marihuánára.

 

Ez annyira kérdező lehet egy viszonylag kisebb eseményről (néhány embernek) az idő ilyen hosszú periódusában az igazság szintén sokat számít. Mi sokat dobtunk az elemzéseink közül azokból az egyénekből, de töprengtünk, hogy sokan a csalfa válaszolók közül, akik azt mondták nem használnak a tesztjük mégis pozitív lett egyszerűen elfelejtették. Lehet, hogy a VSA eszközök jövőbeli tesztjei, amelyek használják ezt a protokollt fokuszálniuk kellene a rövidebb anyagcseréjű osztályba tartozó drogokra (kokain, ópiátok, PCP és metamfetamin). A jövőbeli tanulmányoknak szintén meg kellene fontolniuk, hogy ne tájékoztassák a válaszolókat a kísérlet céljáról, amíg befejezték az adatgyűjtést. Az IRB rendszeresen ilyen csalást hagyott jóvá hosszasan az alávetettek kihallgatása után, miután a jelentéseket összegyűjtötték. Ez problémákat küszöbölne ki azzal, hogy megengedné azt, hogy az alávetettek tudják milyen kérdések vannak hátra. Ez szintén eltávolítana bármilyen tesztelő hatást a tanulmányra.

 

Ráadásul a két forrás az ugyanakkor nem gyűjtött adatokra- CVSA adatot gyűjtöttek elsőként követve az LVA- t. Volt egy potenciál az arrestees mintájára, aki beírt a két különböző időfázis között, ami különbözött vagy a részvételi arány változott az időben. Ráadásul az interjúvolók az idő alatt annyira javították a technikájukat annyira, hogy ők kényelmesebbek voltak, amikor az LVA projekt a CVSA projekttel összehasonlítva elkezdődött. A kísérletünk, hogy elkerüljünk egy lehetséges „érlelés” problémát egy interjúvoló levezeti a CVSA interjúk mindegyikét, amíg a második interjúvoló levezeti az LVA interjúk egészét. Mindkét interjúvoló ajándék volt az egész idő alatt nyújtott segítségükkel. Az volt a reményünk, hogy az interjúvoló csapat egy magas tapasztalati szinten pufferel bármilyen más problémát összehasonlíthatósági mintával, de maga a protokoll hatott a témák hasonlóságára. Bármilyen különbségek miatt megállni, irányítottunk előzetes analízist (nem mutattuk itt) a csalások összehasonlított arányai, a témák százaléka, akiknek pozitív lett a drog tesztjük, és a demográfiai jellemzők. Az előzmények megmutatták, hogy nem voltak jelentős különbségek a CVSA és az LVA minták között.

 

Mi szintén elismerjük azt, hogy bőség zavara van az ópium és a heroin használata között, és annak ellenére, hogy valaki nem használt heroint még mindig pozitív tesztet tudott adni opiátok használatára. A jövőbeli tanulmányoknak jól kell szerepelniük, e probléma számításba vételénél. Szintén felismerjük azt, hogy a VSA és poligráf technológiát általában arra használják, hogy felismerjen egyetlen velejárót (egy gyilkost, egy speciális csalást). A tesztünk tartalmazza öt különböző gyógyszer legutóbbi alkalmazásával kapcsolatos kérdések sorozatát, bár lehetséges nem tökéletes a teszt. Végül felismerjük azt, hogy habár úgy látszott, hogy sok válaszoló kényszerült hazudni, a mi protokollunk nem hoz létre (nem tud) kockázati szintet, ami fennáll egy tipikus interjúban a rendőr és a gyanúsított között. Azt mondták el hisszük, hogy a kockázat szintje (a társadalmi kívánatosság formáiba) nem áll fenn egy tanulmányban attól, hogy sok válaszoló hazudott, bár tudták, hogy elvégezzük, a drog tesztet, megcsináltuk ezt az első tanulmányban, ami alkalmas volt, hogy leteszteljük ezeket a termékeket egy élő igazságügyi környezetben. Megjöttünk egy reálishoz közeli világhelyzethez, ami az erőből lehetséges.

 

Szólj hozzá!

Szereti

2008.07.22. 21:17 Zimankó

Ki szereti Dórit? Hát ki ha én nem ;)

Imádlak Kicsim, és remélem, hogy még sokáig meg is marad ez az érzés.

2 komment

süti beállítások módosítása