Newton Dictate

Više od 900 korisnika medicinske i pravne struke koristi sustav, uskoro bi mogli i mediji

Marko Poljak, direktor tvrtke Newton Technologies Adria
 Krume Ivanovski

Princip je prilično jednostavan: korisnik uz pomoć mikrofona diktira računalu, a izgovorena riječ automatski se pretvara u tekst. Tako, ukratko, funkcionira Newton Dictate, prvi specijalizirani program koji zvučnu snimku algoritamski "ispisuje" kao riječi, koji je razvila tvrtka Newton Technologies Adria, zagrebačka podružnica u vlasništvu praške grupacije Newton Media, kojoj je na čelu Marko Poljak.

Njihovi korisnici većinom su medicinske i pravne struke, od kliničkih centara, poliklinika i specijalnih bolnica do odvjetnika i sudaca, a trenutačno ih je više od 900. Novinarima kojima je skidanje intervjua s diktafona jedna od većih noćnih mora, to zvuči kao savršeno rješenje, a dobra je vijest da ova tehnologija probija i u tu branšu.

Njezin je razvoj započeo još 2006., a neprestano se radi na nadogradnji te nadopuni specijaliziranih rječnika. Poljak pritom posebno napominje da kontinuirano osluškuju potrebe tržišta te tome prilagođavaju razvoj proizvoda. Primjerice, počeli su s Radiološkim rječnikom, a sada rade na Općem medicinskom rječniku, koji uključuje razne grane medicine (interna, patologija, citologija, fizikalna medicina i rehabilitacija).

- Neprestano osluškujemo potrebe tržišta i prilagođavamo razvoj proizvoda. Cilj je uključiti sve kako bi sustav bio primjenjiv u svim bolnicama i poliklinikama u Hrvatskoj. Sretni smo što je sustav počeo razbijati averziju prema novim tehnologijama i što su korisnici prepoznali sve prednosti koje im ona može donijeti - kaže Poljak te dodaje da im je trenutačno fokus na razvoju glasovnih tehnologija za slavenske jezike, konkretno za regiju Adria, pa je Newton Dictate dostupan na hrvatskom, slovenskom i srpskom jeziku.

Kako sustav, zapravo, funkcionira?

- Umjesto da se troše sati i sate na pretipkavanje, korisnik pokrene sustav, diktira u mikrofon koji je uključen u računalo i na njegovu se ekranu ispisuje tekst. Sadrži mogućnost diktiranja izravno na početnu stranicu sustava, no korisnik ima mogućnost diktirati i u bilo koji sustav od interesa, primjerice Word, pretraživač Google ili e-poštu. Navedena funkcija svakako je prednost s obzirom na to da korisnici mogu diktirati izravno u svoje dokumente te ih ispravljati ili nadopunjavati, što skraćuje proces izrade dokumenta - pojašnjava Maša Martinić, direktorica operacija u tvrtki.

Nude i niz drugih funkcija, koje omogućuju i personalizaciju samog sustava, poput samostalnog dodavanja riječi i predložaka. Primjerice, funkciju naknadne transkripcije audiozapisa, koja omogućuje da korisnik snimi diktat pomoću diktafona i potom isti zvukovni materijal učita u sustav koji ga transkribira. Pritom napominju da je za diktiranje potrebno koristiti odgovarajući specijalizirani rječnik, a trenutačno u ponudi imaju Radiološki rječnik, Opći medicinski, Pravni, Opći (medijski) i rječnik za Parlament. Kao nedostatak, u tvrtki navode činjenicu da rječnike stvaraju od anonimiziranih tekstova, što znači da nedostaje mnogo imena i prezimena te imena ulica (sadrže samo one koji se najčešće spominju u medijima). U praksi, kada korisnik izgovori ime, prezime ili bilo koju riječ koju rječnik ne sadrži, sustav ispiše fonetski najsličniju varijantu.

- Korisnici često steknu dojam da ih sustav ne razumije dobro i da griješi, međutim, upravo zbog takvih slučajeva funkcija samostalnog dodavanja riječi mnogo znači s obzirom na to da svatko vrlo jednostavno može upisati riječi, kombinacije riječi i kratice, dodati ih u rječnik te učiniti da sustav sljedeći put izdiktiranu riječ ispiše točno onako kako ju je korisnik i izgovorio - pojašnjava Martinić.

Uz Newton Dictate, tvrtka nudi i usluge prijepisa te automatsku transkripciju audio i video materijala.
- Newton Dictate najtraženiji je proizvod, no korisnici su često zainteresirani i za prijepis audiomaterijala sa sjednica i sastanaka - zaključuje Poljak.


Philips
Specijalizirani program koji pretvara glas u tekst

Alat za novinare, kućanstva i osobe s invalidnošću


Potreba za sustavom najviše se pokazala u području zdravstva i pravosuđa, no i mediji ulaze u tu kategoriju te u ponudi imaju i Opći (medijski) rječnik. Sada slijedi potencijalno testiranje rječnika. Uz to, razvijaju i tzv. call centar rješenja, što će tijekom 2019. privesti kraju (transkripcija poziva, detektiranje ključnih riječi i sl.), a primjenjivost sustava Newton Dictate i glasovnih tehnologija vide i u drugim poslovnim sferama, poput glasovnog upravljanja uređajima koji se koriste u kućanstvima, ali i kao izvrstan alat za osobe s invaliditetom. (J.T.)

Želite li dopuniti temu ili prijaviti pogrešku u tekstu?
Linker
19. travanj 2024 20:27