기사 메일전송
UAE 기술혁신연구소, 세계 최대 아랍어 자연어처리 모델 NOOR 출시
  • 편집국
  • 등록 2022-04-12 13:01:46
  • 수정 2022-04-12 17:45:03

기사수정
  • 100억 개 변수 포함하는 가장 강력한 아랍어 모델 자동 요약, 챗봇, 맞춤형 마케팅 서비스 제공

기술혁신연구소의 크로스센터 사업단이 세계 최대 규모의 아랍어 자연어 처리(NLP) 모델인 누어(NOOR)를 출시했다

아부다비 첨단기술연구위원회(ATRC) 산하의 글로벌 연구센터이자 응용연구 전담기관인 기술혁신연구소(Technology Innovation Institute, 약칭 TII)가 세계 최대 규모의 아랍어 자연어 처리(NLP) 모델인 누어(NOOR)를 출시했다고 8일 발표했다.

TII의 선임 연구원 및 인공지능(AI) 전문가팀은 라이트온(LightOn)과 협력해 아랍어 NLP 모델을 혁신하기 위해 기업에 적용되는 대규모 기계 지능(machine intelligence)을 개발했다. NOOR 모델은 크롤링, 필터링 및 큐레이션 등 단대단 파이프라인 고품질 데이터를 제공해 언어 영역을 넘어 작업을 수행할 수 있는 기능을 갖추고 있다. 또한 이 모델은 효율적인 추론과 모델 특성화를 통해 애플리케이션을 제공할 수 있는 방대한 규모의 분산형 훈련과 서비스를 활성화한다.

TII 및 어스파이어(ASPIRE)의 CEO인 레이 O. 존슨(Ray O. Johnson) 박사는 “이번 개발로 우리는 아부다비와 아랍에미리트의 위상을 진지한 연구 생태계로 격상시키는 것은 물론 연구 역량과 적격성 향상을 위한 궤도에 진입했다”며 “우리의 전문가팀은 이 지역이 전 세계에 영향을 미칠 수 있는 획기적인 R&D 성과를 이뤄낼 수 있음을 다시 한 번 입증했다”고 말했다.

TII의 AI 크로스센터 사업단 이사인 에브테삼 알마즈루에이(Ebtesam Almazrouei) 박사는 “대규모 언어 모델이 전 세계의 자연어 처리 분야에 큰 변화를 일으켰다”며 “세계에서 가장 규모가 큰 아랍어 모델로 100억 개의 매개변수를 포함하는 첨단 모델을 개발하게 돼 자랑스럽다. 모델 훈련을 위해 수집된 독자적인 대규모 아랍어 데이터세트는 다양한 소스를 큐레이션·스크래핑·필터링하는 등 수개월간 공들인 작업의 결과물”이라고 말했다. 이어 “NOOR가 전 세계 학계와 업계가 찾는 아랍어 분석 모델이 되도록 이 프로젝트에 힘을 쏟은 팀에 특별한 감사의 뜻을 전한다”고 덧붙였다.

TII 디지털 과학 연구 센터 및 AI 크로스센터 사업단의 수석연구원인 메루아니 데바(Mérouane Debbah) 박사는 이번 출시에 대해 “NOOR를 통해 TII는 이 새로운 세대의 AI 연구에서 여러 학문 분야에 걸친 고급 전문지식을 구축할 수 있는 대규모 언어 모델의 노하우를 활용함으로써 현대 표준 아랍어 모델의 범위를 확대했다”고 강조했다.

300억 개 이상의 단어를 포함하는 NOOR 고유의 데이터세트는 모든 영역을 망라하는 세계 최대의 고품질 아랍어 데이터세트를 체계화하기 위해 웹 데이터와 서적, 시, 뉴스 및 모델의 적용 가능성을 크게 확장하는 기술 정보를 결합한다.

에브테삼 알마즈루에이 박사는 NOOR 모델은 흔히 사용하는 변환기 아키텍처를 기반으로 한다고 밝혔다. GPT-3 구조와 유사한 디코더 전용 모델로 더 나은 위치로의 임베딩(embedding) 등 개선사항을 포함해 최신 머신 러닝 기술 발전을 반영하고 업그레이드된 아키텍처를 통해 생성 과제를 처리하도록 프로그래밍했다. TII는 NOOR 데이터세트의 규모에 맞는 품질을 보장할 수 있도록 머신 러닝 기술을 기반으로 자동 필터링 파이프라인을 설계했다. 이 툴은 품질 참조와 같은 원문을 식별하고 스팸 콘텐츠에 노출되지 않도록 지켜준다.

첨단 3D 병렬 처리를 활용하는 NOOR는 128개 A100 GPU를 통해 고성능 컴퓨팅 리소스에 대한 훈련을 거쳐 연산 배분을 할 수 있고 하드웨어 리소스의 효율적 사용을 보장한다.

크로스센터 사업단 이사는 이는 인공지능을 통해 더 광범위한 아랍에미리트 전략에 기여하려는 사업단 노력의 첫 단계일 뿐이라고 강조했다.

아랍어의 ‘빛(Light)’에서 이름을 딴 이 모델은 마음을 깨우쳐주는 것과 아랍어 모델의 상관관계가 성립된다는 의미를 담고 있다.

기술혁신연구소(TII: Technology Innovation Institute) 개요

웹사이트 www.tii.ae 참조.

*출처: AETOSWire

사진/멀티미디어 자료: https://www.businesswire.com/news/home/52671760/en

[이 보도자료는 해당 기업에서 원하는 언어로 작성한 원문을 한국어로 번역한 것이다. 그러므로 번역문의 정확한 사실 확인을 위해서는 원문 대조 절차를 거쳐야 한다. 처음 작성된 원문만이 공식적인 효력을 갖는 발표로 인정되며 모든 법적 책임은 원문에 한해 유효하다.]

언론연락처: 기술혁신연구소(Technology Innovation Institute) 스네하 시바안드(Sneha Sivanand)

이 뉴스는 기업·기관·단체가 뉴스와이어를 통해 배포한 보도자료입니다.

0
  • 목록 바로가기
  • 인쇄


최신뉴스더보기
많이 본 뉴스더보기
  1. 신한투자증권, AI 전문가 노현빈 박사 영입으로 혁신 서비스 가속화 신한투자증권(대표이사 김상태)은 금융 분야의 생성형 인공지능(AI) 생태계 선도와 혁신 서비스 제공을 위해 노현빈 전 뤼이드 AI수석연구원을 ‘AI솔루션부장’으로 영입했다고 21일 밝혔다. 신한투자증권은 자본시장에서 AI가 미치는 미래 성장 잠재력과 중요도를 감안해 올해 6월 전사 AI 적용 사업화를 총괄하는 AI솔루션부를 신설했으며, ...
  2. BNK부산은행, BNK프랜차이즈론 우대업체 선정 BNK부산은행(방성빈)은 부산 대표 프랜차이즈 기업인 ‘원카츠’, ‘푸줏간’, ‘호맥’과 ‘BNK프랜차이즈론’ 우대업체 선정 협약식을 가졌다고 21일(수) 밝혔다. ‘BNK프랜차이즈론’은 프랜차이즈 본사의 재무 건전성과 향후 사업의 성장 가능성 등을 심사해 우수 프랜차이즈 가맹점을 선정하고 해당 가맹주와 예비 점주에게 금리우대 등...
  3. 함께하는한숲, 신용보증기금과 사랑의 원목 벽시계 만들기 봉사활동 진행 따뜻한 세상을 만들어가는 함께하는한숲(이사장 권훈상)은 신용보증기금(이사장 최원목)과 지난 8월 20일 서울 구로에 위치한 신용보증기금인재개발센터에서 신입직원을 대상으로 사랑의 원목 벽시계 만들기 봉사활동을 진행했다고 밝혔다.사랑의 원목 벽시계 만들기 봉사활동은 시계가 없어 일상생활에 불편함을 겪고, 그로 인해 시간에..
  4. KB국민은행, 디폴트옵션 고위험 포트폴리오 수익률 3회 연속 은행권 1위 기록 KB국민은행(은행장 이재근)의 퇴직연금 디폴트옵션(사전지정운용제도) 고위험 포트폴리오1 상품이 13일 고용노동부가 발표한 ‘2024년도 2분기 디폴트옵션 주요 현황 공시’에서 은행권 디폴트옵션 상품 중 연간 수익률 1위를 기록했다.‘퇴직연금 디폴트옵션’은 가입자가 퇴직연금 적립금에 대해 별도의 상품 운용지시를 하지 않을 경우 ...
  5. BNK부산은행, HSBC 선정 ‘2023년 STP Excellence Award’ 수상 BNK부산은행(은행장 방성빈)은 글로벌 금융기관인 HSBC로부터 2023년 외화송금 자동처리 최우수기관으로 선정돼 ‘STP Excellence Award’를 수상했다고 19일(월) 밝혔다.‘STP Excellence Award’는 해외송금 처리에 대한 신속정확도를 기준으로 평가하는 ‘외화송금 자동처리비율(STP Rate : Straight Thtough Process)’이 우수한 은행에 매년 부여되고 있다. 이 ..
서울안심소득
재택치료_상담_진료방법안내
모바일 버전 바로가기