[쿠키과학] 인간처럼 '중요한 장면만 선별하는 AI' 등장

[쿠키과학] 인간처럼 '중요한 장면만 선별하는 AI' 등장

IBS, 복잡환경에서 중요정보 선별 ‘Lp-컨볼루션’ 개발
필터 확대해도 안정적 작동, 정확도 향상
AI-뇌과학 연결고리 강화 후속연구 기대

기사승인 2025-04-22 10:24:02
뇌의 시각 피질과 인공지능 신경망의 정보 처리 구조. 뇌 시각피질에서는 뉴런들이 중심을 기준으로 넓고 부드럽게 연결되어 있으며, 이 연결 강도는 거리마다 점진적으로 달라지는 특성을 보인다(a, b). 이런 공간적 연결성은 종 모양의 곡선으로 표현되는 ‘가우시안 분포’를 따르며, 뇌가 시각 정보를 처리할 때 중심뿐 아니라 주변까지 아우르며 정보를 통합할 수 있도록 돕는다. 반면, 기존의 합성곱 신경망(CNN)에서는 뉴런이 정해진 사각형 범위(예: 3×3, 5×5 등)만을 고정적으로 바라보며 정보를 처리한다(c, d). CNN의 필터는 이미지 위를 일정 간격으로 이동하며 동일한 방식으로 정보를 추출하기 때문에, 멀리 떨어진 시각 정보 간의 관계를 파악하거나 중요도에 따라 선택적으로 반응하는 데 한계가 있다. 이번 연구에서는 이러한 생물학적 구조와 CNN의 차이에 착안해, 뇌의 연결 특성을 모방한 새로운 방식의 필터 구조인 'Lp-컨볼루션'을 제안했다. 이 구조에서는 뉴런이 입력을 받는 범위와 감도의 분포가 가우시안 형태로 자연스럽게 퍼지도록 설계되며, 중요한 정보는 더 강하게 반영하고 덜 중요한 정보는 적게 반영되도록 학습 중 스스로 조절된다. 이를 통해 기존 CNN보다 더 유연하고 생물학적 특성에 가까운 방식으로 이미지를 처리할 수 있게 된다. IBS

인간의 시각 시스템은 한눈에 사물을 인식하고, 복잡한 환경에서도 중요한 정보를 빠르게 선별하는 능력을 갖고 있다.

이에 비해 AI의 합성곱 신경망(CNN)은 작은 정사각형 필터로 이미지를 쪼개 분석하는 구조로, 적은 연산으로도 잘 작동하지만 넓게 파악하거나 서로 떨어진 정보의 관계를 이해하는 데 한계가 있다. 

또 이를 보완한 비전 트랜스포머는 막대한 연산량과 대규모 데이터세트가 필요해 실용성에 제한이 있다.

뇌 시각처리 모방한 AI 이미지 인식기술

기초과학연구원(IBS) 이창준 인지및사회성연구단장 연구팀이 연세대 송경우 교수팀과 공동으로 뇌의 시각피질이 시각정보를 선별해 처리하는 방식을 응용, 인공지능(AI)의 이미지 인식능력을 향상시키는 기술을 개발했다.

공동연구팀은 뇌의 시각피질이 시각정보를 선택적으로 처리하는 방식에 주목했다.

인간의 시각피질은 모든 정보를 똑같이 처리하지 않고 눈에 띄는 특징이나 중요한 부분에 집중해 선택적으로 반응하는데,  이 과정에서 뉴런은 넓은 범위를 부드럽게 감지하면서 꼭 필요한 정보에만 선택적으로 반응하는 구조를 갖는다.

연구팀은 이 방식을 AI에 적용해 CNN 모델의 성능을 크게 높이는 ‘Lp-컨볼루션’ 기술을 제안했다.

뇌의 구조에서 착안한 Lp-컨볼루션 설계. 뇌는 시각 정보를 처리할 때 중심에서 주변으로 점진적으로 퍼지는 가우시안 형태의 연결 구조를 바탕으로 넓은 범위의 정보를 유연하게 통합한다. 반면 기존 CNN은 필터의 범위를 넓히면 넓힐수록 정보가 희석되거나 정확도가 떨어지는 문제가 있다(d, e). 연구진은 이러한 구조적 한계를 극복하기 위해, 뇌의 연결 방식을 모방한 Lp-컨볼루션을 고안했다(a–c). 이 구조는 넓은 수용 영역에서도 핵심 정보를 놓치지 않도록 가중치를 공간적으로 다르게 분포시켜, CNN의 한계를 효과적으로 개선한다. IBS

Lp-컨볼루션은 AI가 이미지를 분석할 때 사람처럼 핵심 정보를 우선 파악토록 설계된 기술이다.

여기에 적용된 지도형태의 필터 ‘마스크(Mask)’는 시각피질의 뉴런처럼 이미지의 중요한 영역을 강조하고, 덜 중요한 부분은 자연스럽게 배제한다.

이 기능은 넓은 수용영역에서도 핵심 정보를 놓치지 않도록 가중치를 공간적으로 다르게 분포시켜 CNN의 한계를 효과적으로 개선, 학습 과정에서 스스로 형태를 조정하며 다양한 환경에서 일관되게 중요한 특징에만 집중할 수 있도록 한다.

연구팀은 이 기술을 다양한 CNN 모델에 적용한 결과 Lp-컨볼루션 적용 모델이 기존 CNN 모델보다 이미지 분류 정확도가 크게 향상됨을 확인했다.

아울러 한 번에 더 넓은 영역을 볼 수 있도록 필터 크기를 확대해도 성능저하 없이 안정적으로 작동했고, 정확도도 향상되는 결과를 얻었다. 

이는 일반적으로 분석 범위를 넓히면 계산량이 증가해 정확도는 떨어지는 것과 반대현상으로, Lp-컨볼루션이 이 같은 한계를 효과적으로 극복한 것으로 풀이된다.

또 연구팀은 Lp-컨볼루션이 실제 뇌의 정보처리 방식과 얼마나 유사한지를 확인하는 실험을 진행했다.

연구팀은 생쥐에게 다양한 이미지를 보여주며 시각피질 뉴런의 활동을 기록하고, 이를 바탕으로 AI 모델이 각 이미지에 대해 뉴런이 어떻게 반응할지 예측토록 학습시켰다.

이렇게 훈련된 모델의 반응과 실제 뉴런 반응을 비교한 결과, Lp-컨볼루션을 적용한 모델은 기존 CNN 모델보다 뉴런 반응을 더 정밀하게 예측했고, 예측 오차도 감소했다. 

이는 Lp-컨볼루션이 단순한 성능 향상을 넘어, 뇌의 시각 정보 처리 방식과 더욱 유사한 구조와 작동방식을 구현하고 있음을 실험적으로 입증한 것으로 의미를 갖는다.

인공지능과 실제 뇌의 시각 반응 비교 실험. 연구진은 살아있는 생쥐의 시각 피질에서 측정한 실제 뉴런의 반응 패턴과 AI 모델에서의 예측 반응을 정밀하게 비교했다. 그 결과 기존 CNN에 비해 Lp-컨볼루션을 적용한 AI 모델은 뉴런 반응을 더 정확히 재현했고, 시각 정보에 대한 처리 방식도 뇌와 더 유사하게 나타났다. 이 실험은 Lp-컨볼루션이 단순히 성능 향상을 넘어, 뇌의 정보 처리 메커니즘과의 구조적 유사성을 갖고 있다는 점을 실험적으로 입증한 것이다. IBS

이번 연구의 제1저자인 권재 IBS 박사후연구원은 “Lp-컨볼루션은 뇌에서 착안한 ‘구조화된 희소성’을 도입함으로써 단순 계산량 증가가 아닌 뇌 중요 부분에 집중해 효율성과 성능을 동시에 확보했다”며 “아울러 뇌 활동 예측에도 뛰어난 성능으로 AI와 뇌과학의 연결고리를 강화했다”고 설명했다.

이 단장은 “이번 연구는 AI와 뇌과학이 함께 발전할 수 있는 새로운 융합 모델의 좋은 사례가 될 것”이라며 “향후 신경과학 분야에서 밝혀지고 있는 다양한 아이디어를 인공신경망에 지속적으로 도입해 AI 성능과 효율을 높이고, 뇌에 대한 이해도 함께 심화시킬 계획”이라고 말했다.

한편, 이번 연구결과는 24~28일 싱가포르에서 열리는 세계적 권위의 AI학회 ‘The International Conference on Learning Representations(ICLR)’서 발표할 예정이다.
이재형 기자
jh@kukinews.com
이재형 기자
이 기사 어떻게 생각하세요
  • 추천해요
    0
  • 슬퍼요
    0
  • 화나요
    0
추천기사
많이 본 기사
오피니언
실시간