Nothing from Something: Can a Language Model Discover 0?
- 1.언어모델이 학습 데이터를 넘어 '0' 개념을 독자 발견할 수 있는지 산술로 검증
- 2.GPT-2 규모 모델은 언어 사전학습 여부와 무관하게 테스트 시 일반화 실패
- 3.수십~수백 개 예시 학습 후엔 상당히 개선됨
- 4.언어 사전학습이 필요한 예시 수를 약 50% 감소시켜 수학 발견을 지원
왜 중요한가?
수학적 발견에 필요한 강한 분포 외 일반화 능력을 언어능력이 비계처럼 뒷받침할 수 있음을 보여, AI의 수학 지식 확장 가능성 논의에 실증적 근거를 더했다.
🏷️ 언급 프로젝트
본문 미리보기
arXiv:2606.17289v1 Announce Type: new Abstract: AI systems based on artificial neural networks are being developed with aspirations of pushing the boundary of human mathematical knowledge. A key question for these systems is how much they can reach beyond their training data. Mathematical discovery requires a strong form of out of distribution generalization; the ability to hypothesize genuinely new - and potentially logically more powerful - mathematical structures. It has been hypothesized th
전체 내용이 궁금하다면?
원문을 직접 읽어보세요