Transformer가 등장한 이후 BERT와 GPT 기반 자연어 처리 모델들은 점점 더 거대해지며 다양한 Task를 성공적으로 수행하고 있습니다.
우리가 하루 업무시간의 대부분을 다양한 지적 업무(Task) 에 사용한다는 점을 생각해 보면, 이러한 AI 모델이 업무에 적용될 때 가장 큰 부가가치가 창출될 것입니다.
특히 전 세계에서 가장 큰 산업 중 하나인 제약바이오 산업은,
1. 인구 고령화
2. COVID-19와 같은 신규 질환 증가
3. 비만·항노화 등 대규모 시장 형성
4. 바이오 혁신 기술 개발 속도 가속화
와 같은 요인으로 빠르게 성장하고 있습니다.
시장 규모 역시,
400조원(2000년) > 2000조원(현재) > 3000조원(2030년대 초)
로 확대되고 있으며, 앞으로도 가장 큰 부가가치가 만들어질 산업 중 하나입니다.
이 제약바이오 산업에서 종사하는 전 세계 1,000만 명의 업무 본질은 결국 Data-Driven Decision Making 입니다.
저희는 제약바이오 텍스트를 더 깊이 이해하고 정리하며 의사결정을 돕는 LLM을 개발하고, 이를 기반으로 뉴스레터, 데이터베이스 등 다양한 서비스를 만들고 있습니다.
현재의 LLM은 웹상의 방대한 텍스트를 학습하며 많은 사람들에게 놀라움을 주고 있지만, 제약바이오 업무 Task를 수행하기에는 여전히 한계가 있습니다.
또한 앞으로 2년 이내에 웹 기반 학습 데이터 자체가 고갈될 것이라는 전망도 있습니다.
실제 제약바이오 업무 Task를 수행하기 위해서는 단순히 인터넷 데이터를 학습하는 것이 아니라, 해당 산업에 특화된 고품질 학습 데이터셋이 반드시 필요합니다.
저희는 3년 전부터 이 학습 데이터셋을 지속적으로 구축하고 학습해 왔습니다.
간단히 말하면,
디자이너에게는 Figma,
개발자에게는 GitHub, StackOverflow, HuggingFace가 있듯이,
제약바이오 업계의 Bio-Research.AI를 만들고 있습니다.
저희의 목표는 5년 뒤 전 세계 1,000만 명의 제약바이오 종사자들이 사무실에 앉아 가장 먼저 접속하는 웹페이지를 만드는 것입니다.
바이오리서치에이아이 채용페이지 :
https://www.notion.so/bioresearchai/Maximize-Global-Pharma-and-Biotech-R-D-Productivity-with-AI-Technology-535186162c7d4e1fbcd4a0f90d1c5db1