본문 바로가기
예전 블로그 글 모음

인공지능 성능 개선을 위한 기록이 깨졌다

by 멋져지는아빠 2021. 10. 27.
반응형

인공 지능 (AI) 모델이 잘 작동시키는 데 알맞은 알고리즘을 가르치는 일은 대개 많은 작업을 필요로 한다. 많은 사람들이 인적 작업을 크라우드 소싱하는 것에서부터 기계 학습의 다양한 측면을 미세 조정하는 것에 이르기까지 다양한 방법을 사용하여 이를 달성했다. 최근 홍콩 침례교 대학교 (HKBU)의 연구팀이 Tencent Machine Learning 팀과 협력하여 AI 기계를 훈련시키는 가장 빠른 방법을 개발했다. 이 새로운 훈련 기술은 AI의 정확성과 수준을 손상시키지 않으면서 빠르고 효율적으로 수행한다.

이 특별한 테스트에서 팀은 AlexNet과 ResNet-50이라는 두 개의 서로 다른 심층 신경 네트워크를 각각 4분과 6분 만에 교육했다. 이는 AlexNet의 경우 11분, ResNet 50의 경우 15분이었던 이전의 교육 시간보다 훨씬 빠른 것이다. 이 두개의 특수 심층 신경망은 시각적 인식에 주로 사용되는 매우 광범위한 데이터 세트 인 ImageNet을 기반으로 구축되었다. 제대로 훈련된 후에는이 시스템이 다른 대상을 인식하고 사진을 기반으로 레이블을 제공할 수 있다.

Chu Xiaowen Dr Chu는 "우리는 정확도를 잃지 않고 최고의 출력을 크게 향상시키는 새로운 최적화된 교육 방법을 제안했다"고 밝혔다. 이 두 가지 교육 방법의 주된 차이점은 컴퓨팅 시간과 의사 소통 시간에 달려 있다. 팀은 이 테스트와 Ach의 두 가지 측면에서 혁신을 달성했는데, 인공지능 시스템 훈련에 새로운 세계 기록을 발표했다.

그들은 더 작은 데이터 블록을 더 큰 데이터 블록으로 결합하여 최적화함으로써 보다 일반적인 FP32방법 대신 '텐서 융합'이라는 통신 기술을 사용하여 FP16으로 알려진 방법을 사용했다. 이는 전송 패턴 및 통신 효율성을 향상시킨다.

매우 견고한 두 개의 심층 신경 네트워크에서 수행된 제한된 테스트였지만 이를 훈련한 기술을 최적화하고 대규모 이미지 분류에 사용할 수 있었다.

반응형
사업자 정보 표시
한켈하우스 | 차원석 | 경기도 성남시 중원구 광명로 411 | 사업자 등록번호 : 711-20-01131 | TEL : 010-3085-4902 | Mail : hankelhaus@hankelhaus.com | 통신판매신고번호 : 호 | 사이버몰의 이용약관 바로가기

댓글