1960 പാരാമൗണ്ട് ന്യൂസ് സമയത്ത് സവിശേഷത, “ഇലക്ട്രോണിക് 'മസ്തിഷ്കം' റഷ്യൻ ഭാഷയെ ഇംഗ്ലീഷിലേക്ക് വിവർത്തനം ചെയ്യുന്നു”, അവതാരകൻ യന്ത്രത്തിന്റെ കഴിവുകളെക്കുറിച്ചുള്ള ചർച്ച അവസാന ചോദ്യത്തോടെ അവസാനിപ്പിക്കുന്നു: “ഇത് മനുഷ്യ വിവർത്തകരുടെ അവസാനമാണോ?” ശാസ്ത്രീയവും സാങ്കേതികവുമായ മെറ്റീരിയൽ വിവർത്തനം ചെയ്യുന്ന മേഖലയിലെങ്കിലും ഗവേഷകൻ അതെ എന്ന് പ്രതികരിക്കുന്നു.
അതിനു ശേഷം 60 വർഷം പിന്നിട്ടെങ്കിലും വിവിധ മേഖലകളിൽ മനുഷ്യ വിവർത്തകരെ ഇനിയും ആവശ്യമുണ്ട്. മനുഷ്യനെ മാറ്റിസ്ഥാപിക്കാൻ പര്യാപ്തമാണെന്ന് കരുതുന്ന വിവർത്തനത്തിൽ കൃത്രിമബുദ്ധി ഇതുവരെ കൃത്യത കൈവരിക്കാൻ കഴിഞ്ഞിട്ടില്ലെന്ന് ഇത് കാണിക്കുന്നു. സന്ദർഭം, പൊരുത്തപ്പെടുത്തൽ, ഭാഷകൾ തമ്മിലുള്ള വ്യത്യാസം എന്നിവ AI-ക്ക് മനസ്സിലായില്ല എന്നതായിരുന്നു പ്രശ്നം. എന്നിരുന്നാലും, AI-യുടെ കുതിച്ചുചാട്ടത്തോടെ, മനുഷ്യനും AI കഴിവുകളും തമ്മിലുള്ള വിടവ് കുറയുന്നു. Meta's നൽകുക തടസ്സമില്ലാത്തM4T.
ഭാഷകൾ തമ്മിലുള്ള വിടവുകൾ നികത്തൽ
SeamlessM4T ഒരു ബഹുമുഖ, മൾട്ടിമോഡൽ, ബഹുഭാഷാ AI വിവർത്തനമാണ് മാതൃക അത് സ്പീച്ച്-ടു-സ്പീച്ച്, സ്പീച്ച്-ടു-ടെക്സ്റ്റ്, ടെക്സ്റ്റ്-ടു-സ്പീച്ച്, ടെക്സ്റ്റ്-ടു-ടെക്സ്റ്റ് വിവർത്തനം എന്നിവയെ പിന്തുണയ്ക്കുന്നു. നിങ്ങൾ സംസാരിക്കുകയോ, ടൈപ്പ് ചെയ്യുകയോ, അല്ലെങ്കിൽ വായന, SeamlessM4T ഭാഷകൾ തമ്മിലുള്ള വിടവ് നികത്താൻ ലക്ഷ്യമിടുന്നു.
അവിടെ ഉണ്ടായിരുന്നു ശ്രമങ്ങൾ ഇത് സൃഷ്ടിക്കാൻ, എന്നാൽ മറ്റ് ഭാഷകളിൽ സമഗ്രമായ സംഭാഷണം നിർമ്മിക്കുന്നതിൽ AI- യ്ക്ക് അന്ന് പ്രശ്നങ്ങളുണ്ടായിരുന്നു. ഇന്ന്, സ്പീച്ച്-ടു-സ്പീച്ച് വിവർത്തനത്തിനുള്ള സീംലെസ് എം4ടിയുടെ പിന്തുണ ഒരു ഗെയിം ചേഞ്ചർ ആയിരിക്കാം. വ്യത്യസ്ത ഭാഷകൾ സംസാരിക്കുന്ന വ്യക്തികളെ ഒരു ഇടനിലക്കാരന്റെ ആവശ്യമില്ലാതെ തത്സമയ സംഭാഷണങ്ങളിൽ ഏർപ്പെടാൻ ഇത് അനുവദിക്കുന്നതിനാലാണിത്.
മെറ്റയുടെ തന്ത്രം
AI ഭാഷാ സാങ്കേതികവിദ്യയിൽ മെറ്റയുടെ മുൻകാല മുന്നേറ്റങ്ങളെ അടിസ്ഥാനമാക്കിയാണ് SeamlessM4T നിർമ്മിക്കുന്നത്. ഇതിൽ ലാംഗ്വേജ് ലെഫ്റ്റ് ബിഹൈൻഡ് (NLLB) മോഡലും യൂണിവേഴ്സൽ സ്പീച്ച് ട്രാൻസ്ലേറ്ററും ഉൾപ്പെടുന്നു. 4 ദശലക്ഷത്തിലധികം മണിക്കൂർ റെക്കോർഡ് ചെയ്ത സംഭാഷണങ്ങളുള്ള ഏറ്റവും വലിയ ഓപ്പൺ സ്പീച്ച്-ടു-സ്പീച്ച്, സ്പീച്ച്-ടു-ടെക്സ്റ്റായ സീംലെസ് അലൈൻ ആണ് ഈ മോഡലിന് കരുത്ത് പകരുന്നത്.
https://twitter.com/EderTeixeira333/status/1694502348884754856?s=20
മെറ്റയുടെ ഓപ്പൺ സയൻസ് പ്രതിബദ്ധതയുടെ തെളിവായി, റിസർച്ച് ലൈസൻസിന് കീഴിലുള്ള റിസർച്ച് ആൻഡ് ഡെവലപ്പർ കമ്മ്യൂണിറ്റിക്ക് സീംലെസ് എം4ടി പുറത്തിറക്കി. ലോകമെമ്പാടുമുള്ള ഗവേഷകർക്കും ഡവലപ്പർമാർക്കും ഇത് നിർമ്മിക്കാൻ കഴിയും, ഭാഷാ തടസ്സങ്ങളെ ഒന്നിച്ച് മറികടക്കുന്ന ആപ്ലിക്കേഷനുകളും പരിഹാരങ്ങളും സൃഷ്ടിക്കുന്നു. വാസ്തവത്തിൽ, നിങ്ങൾക്ക് ശരിയായ മോഡലിന്റെ ഡെമോ പരീക്ഷിക്കാൻ കഴിയും ഇപ്പോള്.
SeamlessM4T യുടെ പ്രത്യാഘാതങ്ങൾ നിരവധി ഡൊമെയ്നുകളിലേക്ക് വ്യാപിക്കുന്നു വിദ്യാഭ്യാസവും ബിസിനസ്സും നയതന്ത്രത്തിനും വിനോദത്തിനും. AI-യെ ആളുകൾ തിരിച്ചറിയുന്നതിനോ വിശ്വസിക്കാൻ തുടങ്ങുന്നതിനോ കുറച്ച് സമയമെടുത്തേക്കാമെങ്കിലും, മനുഷ്യ വിവർത്തകരുടെ ആവശ്യം കുറവാണെന്ന് തോന്നുന്നു. ഇതിന് 60 വർഷത്തിലധികം സമയമെടുത്തു, പക്ഷേ ആ ഗവേഷകന്റെ വാക്കുകൾ ഒടുവിൽ ഫലവത്താകുന്നു.
ഫോട്ടോ കടപ്പാട്: ഫീച്ചർ ഇമേജ് എന്നത് പ്രസ് വീഡിയോയിൽ നിന്നുള്ള മെറ്റീരിയൽ കൊണ്ട് നിർമ്മിച്ച ഒരു കൊളാഷാണ്, അത് മെറ്റയുടെ ഉടമസ്ഥതയിലുള്ളതാണ്.
അവലംബം: NEC / മെറ്റാ
