「韓国を、もっと身近なビジネスパートナーへ」

KOTRAは、韓国の国営貿易投資振興機関です。
(所在地:東京都千代田区霞が関3-2-5 霞が関ビル5階)

HOME > 東京 IT ニュース > 日기업, LLM 국산화 움직임 활발(10.23 니혼게이자이신문)

東京 IT ニュース 詳細

NEW  日기업, LLM 국산화 움직임 활발(10.23 니혼게이자이신문)

- 일본에서 생성형 AI의 기반이 되는 대규모 언어 모델(LLM)의 국산화 움직임이 확산. 키워드는 ‘일본어 특화’로, 소프트뱅크는 2025년도 안에 독자적인 학습 데이터를 구축하는 한편, 소형 LLM을 실용화. NTT도 특정 업종이 사용하기 쉬운 LLM 개발을 추진. 시장을 미중 기업이 장악하는 가운데 일본 문화·관습과 기밀성 대응에서 승부를 걸고 있음.
- 소프트뱅크는 2월부터 조사 회사 마크로밀 등 3개사와 협력해 일본국내 최대 규모의 데이터셋 개발을 진행 중. 이번에는 일본어 대화로 구축해 2025년도 중을 목표로 대외 공개할 예정. AI 서비스 개발 기업 등에 제공해 국산 AI의 기반 데이터로 활용하도록 할 계획.
- 수집한 데이터는 두 종류. 하나는 고객 창구에서의 대응으로, 특정 시나리오에 따른 대화를 수집. 10개 업종에서 2600종류의 대화 예시를 커버. 다른 하나는 잡담으로, AI 개발에서 생생한 대화 데이터가 귀중. 전체의 2/3는 일상 대화 내용을 담음.
- 이번 사업은 경제산업성의 AI 개발 지원 프로그램 ‘GENIAC’의 지원을 받음. 일본정부가 AI 개발에 지원을 아끼지 않는 이유는 일본이 AI 시장에서 뒤처지고 있기 때문. 미국 스탠퍼드 대학이 2024년 발표한 ‘AI 국력 랭킹’에서 일본은 9위에 그침.
- LLM에서도 뒤처짐은 뚜렷. 생성형 AI 성능을 좌우하는 ‘파라미터 수’에서는 상위권을 미중 기업이 독점. 일본 기업들도 10개 이상의 진영이 개발을 진행 중이나, 파라미터 수에서는 일본 1위인 소프트뱅크조차 미국 오픈AI와 약 20배의 차이를 보이고 있음.
- 범용적인 LLM으로는 반전이 어려워지는 가운데, 일본 기업들이 주목하는 것은 이용 영역 등을 제한한 소형 LLM. 소프트뱅크는 올가을부터 소형 LLM 'Sarashina mini' 제공을 시작. 병행 개발 중인 대형 LLM에서 중요 데이터만 이식해 대형판의 10% 수준 크기로 지식 폭과 추론 능력을 계승.
- 금융·제약 등 업계 대형 5사와 공동 연구도 진행 중. 데이터 가치 판단과 업무 흐름 등 고유 노하우를 학습해 개발에 반영. 각사의 허가를 얻은 후 비즈니스의 생생한 정보를 확보하여 미중 LLM에 대응하겠다는 생각.
- NTT도 10월부터 자체 개발한 소형 LLM ‘츠즈미 2’ 제공을 시작. 파라미터 수를 약 300억 개로 한정해, ‘24년 상용화한 기존 버전과 마찬가지로 1개의 GPU만으로 작동.
- 기동성을 유지하면서도 크기가 수 배 이상인 LLM에 필적하는 일본어 처리 성능을 확보. 금융, 의료, 지자체 분야에 특화된 전문 지식도 학습시킴. 각 분야에서 고객 맞춤형으로 최적화할 때 소량의 추가 학습 데이터만으로 정밀한 답변이 가능하도록 구성함.
- 이 외에도 라쿠텐은 네트워크 서비스에서 사용하기 편리하도록 개인별로 응답을 최적화할 수 있는 기능을, NEC는 폐쇄된 환경에서의 고속 추론과 같은 사용 편의성을 각각 다듬고 있음