Can Computers Think?: 모리타 마사오, 『계산하는 생명』(2022)

학부 시절 matplotlib로 그래프를 그리는 건 꽤 즐거운 일이었다. 엑셀로 그린 그래프는 묘하게 안 예뻤다. R로 할 때도 있었지만, 실험 데이터와 ideal case를 비교할 때 matplotlib만큼 그림이 예쁘게 나오는 tool이 없었다. 직장생활을 할 때엔 수치보단 패턴들을 많이 보는 일을 했기 때문에, 안 쓴 지 거의 7~8년 정도 된 것 같다.

과거에 취업 준비하면서 정리한 반도체 소자·공정 자료를 Claude에게 정리하게 하면서, .svg가 아닌 .png로 그림을 뽑아달라고 했더니, Claude는 matplotlib을 꺼내서 그렸다. LLM 서비스를 가장 투명하다고 느끼는 이유 중 하나는 문제 해결과정을 하나 하나 보여줄 때가 있다는 것인데, 내 피드백을 함수화해서 조건식으로 만들고, 미분방정식을 풀듯 조건을 도출해서 새로운 제약식을 만들어 그에 맞는 모듈을 호출했다. 그 코드를 보고 꼬리에 꼬리를 무는 궁금증이 생겼다.

컴퓨터는 boolean 연산이 기본이다. 그런데 boolean 연산이 기본인 기계가, 수학을 기호 조작이 아니라 언어처럼 다룬다면? 모방이 아니라 어느 정도 논리 체계로 언어를 가져온다면? 그것이 이미 구현되어 있다면, 그것이 왜 가능하고 어떻게 가능한가?

물론 모리타 마사오가 이 책을 썼던 시점엔 GPT 3.5 정도만 나왔던 시점이었다. 그리고 이 책은 기술적인 설명을 길게 해주기에는 너무나 가볍고 얇다. LLM이 틀릴 수 있으니 검수가 필수다란 문장은 나오지도 않는다. (사실 그 옛날 인터넷과 컴퓨터가 처음 나오고, 종이 신문이 처음 나왔을 때도 항상 가졌어야 했던 태도인데 지금에서야 새로 새겨야할 말은 아니다. 오히려 그 문제에서 쟁점은 어떻게 검수할 것이냐에 관한 질문이다) 그 수준을 넘어 호기심 가득하게 LLM 서비스를 이용하고 있다면, 이 책이 건네는 계산(compute)의 역사에 대한 통찰은, 우리가 일하고 생각하는 방식을 바꾸고 있는 AI를 조망할 좋은 context가 되어줄 것이다.

계산은 어떻게 '사고처럼' 보이게 되었나

계산이 사고와 유사하게 보이는 이유는, 역설적인 표현이지만, 계산이 세계를 점점 더 넓게 확장하며 '닫아'왔기 때문이다. 더 많은 것을 다룰 수 있게 된 만큼, 그 안에서는 바깥을 참조하지 않고 규칙만으로 굴러가는 자족적인 체계가 되어왔다는 뜻이다. 계산은 본질적으로 추상화다. 사과 하나와 사과 하나를 합하면 사과 하나와 사과 하나가 아니라 사과 둘이 되는 것은 그 자체에 '사과'라는 개체에 대한 추상이 있다. 그 추상적인 규칙의 적용이 정교화되면서, 동시에 확장되어온 것이 계산의 역사다. 그러니 '안드로이드는 전기양의 꿈을 꾸는가'를 묻기 전에, 계산이 어떻게 정교화되고 확장되어 왔는지를 묻는 게 먼저다.

시작은 표기였다. 화이트헤드는 좋은 표기법이 뇌를 해방한다고 했다. 손가락으로 하나하나 세던 머리를, 기호가 대신 받아주는 순간 우리는 더 높은 문제로 올라간다. 점토판에 찍힌 회계 토큰에서 숫자가 태어났다는 이야기를 떠올리면, 표기란 결국 세계의 일부를 떼어내 다룰 수 있는 형태로 굳히는 기술이었다. (공교롭게도 오늘날 LLM이 세계를 잘게 부수어 다루는 단위의 이름도 '토큰'이다.) 추상적인 표기법이 간단해지면서, 인간은 숫자 표기가 아닌 계산 과정 자체에 더 집중할 수 있게 되었다.

본격적인 출발점에는 데카르트가 있다. 좌표평면으로 기하와 대수를 하나로 묶어 해석기하학을 창안하고, 동물과 자연을 정교한 기계로 보았다. 데카르트는 세계를 계산 가능한 것으로 만들었으나, 마음만은 끝내 계산 바깥에 남겨두었다. 사유하는 실체는 명시적으로 비-기계라는 것이다. 동물은 기계여도 인간의 정신은 끝까지 기계가 되지 않았다.

그런데 인간을 계산 바깥에 남겨둔 것은 데카르트만이 아니었다. 칸트를 보자. 그에 따르면 "7+5=12"조차 순수한 논리만으로는 나오지 않는다. 7에서 시작해 다섯 개를 하나씩 세어 더해가야 비로소 12에 이르는데, 그 과정에는 시간 속에서 하나씩 헤아리는 인간의 직관이 반드시 개입한다는 것이다(선험적 종합판단). 데카르트가 마음을 남겼듯, 칸트는 산술의 바닥에 직관을, 곧 인간을 남겨둔 셈이다.

프레게는 바로 그 마지막 직관마저 걷어내려 했다. 수의 확실성을 직관이 아닌 논리의 영역으로 옮기려 한 것이다. 그는 수학의 함수 개념을 논리 전반으로 일반화해서, 주어와 술어로 문장을 나누던 분석을 함수와 논항(함수에 들어가는 입력)의 분석으로 바꾸었다. 항에 대응하는 명확한 값이 존재하고, 개념은 참·거짓이라는 값으로 가는 함수가 된다. 언어를 완벽한 논리 체계로 환원하려는 프로젝트였다. 인간 의식의 문제였던 계산이 이제 언어로 꺼내어져, 내면에서 해방되고 타자와 공유 가능한 외부적 형식논리가 된 것이다. (물론 프레게의 '개념의 외연'은 러셀의 역설에 부딪히지만, 이 논의는 생략한다.) 데카르트가 마음에, 칸트가 직관에 남겨두었던 인간이, 프레게에 이르러 마침내 계산에서 지워지기 시작한 것이다.

이 계보를 끝까지 밀어붙인 사람이 튜링이다. 그는 계산하는 인간(computer)의 행동을 관찰해 종이·규칙·상태로 추상화한 뒤, 그 모델에서 인간을 지워버렸다. 머릿속도 문화적 맥락도 모두 소거하고, 계산하는 사람을 극한까지 덜어낸 것이다. 살아있는 인간이 전제되지 않은 순수한 '계산' 개념이, 그렇게 탄생했다(1936).

그리고 바로 그 지점에서, 정반대 방향의 반론이 나온다. 후기 비트겐슈타인이다. 그의 규칙 따르기 논변에 따르면, 규칙을 따른다는 것은 머릿속 사적 과정이 아니라 공동체의 실천에 참여하는 일이다. '맞다'와 '틀리다'를 가르는 외부 기준이 있어야 규칙 따르기가 비로소 성립한다. 그러므로 비트겐슈타인에게 계산하는 것과 계산하는 것처럼 보이는 것은 다르다. 기계는 기호를 조작하지만, 그 기호에 의미를 부여하는 것은 공동체이기 때문이다. 공교롭게도 두 사람은 1939년 케임브리지의 수학기초론 강의실에서 실제로 맞붙었다. 튜링의 계산 기계가 세상에 나온 지 3년 뒤, 그것을 만든 이와 그것이 계산하는 게 아니라고 본 이가 같은 방에 앉아 정반대를 보고 있었던 것이다.

튜링을 넘어: 계산이 곧 사고라면

튜링의 계산 개념에는 외부와의 접촉이 없다. 신체도, 관점도, 세계도 필요 없다. 입력을 넣으면 연산을 거쳐 출력이 나올 뿐이다. 그리고 바로 이 무접촉이 묘한 안도감을 준다. 우리는 튜링 덕분에, 계산이란 어떤 이해도 필요로 하지 않는 행위라는 착각 속에 살 수 있게 되었다. 계산은 정신 아래에 안전하게 깔린 기계장치이고, 진짜 사고는 그 위 어딘가 인간만의 자리에 따로 있다는 그림이다. 데카르트가 마음에 쳐둔 울타리를 튜링이 넘었다지만, 우리는 여전히 그 울타리 안쪽 어딘가에 '이해'라는 성역이 남아 있다고 믿고 싶어 한다.

그런데 계산을 그저 산술로만 봐온 사람들의 안도감이 요즘 깨지고 있다. 인간의 개입을 전제하지 않은 계산기가, LLM 시대를 맞아 '지적노동'이라 분류해 둔 일들을 하기 시작했다. 글을 쓰고, 증명을 따라가고, 코드를 짜고, 제약식을 세운다. 정신에서 분리하고 싶었던 산술을 기계장치에 넣었다고 생각했는데, 사실 정신의 지적 활동을 튜링 기계가 장악하기까진 오래 걸리지 않았던 것이다.

이러한 시대에 각자가 취할 수 있는 태도는 두 갈래 길 정도 된다. 첫째는 기계는 지적노동을 흉내 낼 뿐 거기에 이해는 없으며, 산술과 사고는 다르다는 입장이다. 둘째는 우리가 그간 지적노동이라 불렀던 것 자체가 애초에 정교한 계산 이상이 아니었고, 기계가 우리 수준으로 올라온 것이 아니라 우리 수준이 줄곧 계산이었음을 인정하는 것이다. 둘째는 용감해 보이지만, 그렇다면 우리가 지켜온 고유성이라는 것이 처음부터 환상이었다는 불편한 결론에 이른다.

두 입장은 정반대로 보이지만, 실은 한 가지를 똑같이 깔고 있다. 계산이란 곧 튜링이 못박은 그 무접촉의 기호 조작이라는 전제다. 첫째는 그 좁은 계산과 사고는 다르다 하고, 둘째는 그 좁은 계산이 사고의 전부였다 한다. 그러나 만약 계산이 처음부터 그렇게 좁은 것이 아니었다면? 두 길이 함께 선 그 전제 자체가 흔들린다면, 우리는 다른 출구를 찾을 수 있을지도 모른다.

어느 길이 맞는지 기계만 들여다봐서는 알 수가 없다. 두 길이 함께 선 전제인 계산이 무엇인가에 대한 개념이 흔들리는 마당에, 기계가 사고하느냐를 묻는 것은 너무 이르다. 먼저 물어야 할 것은, 우리가 '사고'라 부르는 것이 정말 기계가 해치우는 그 '지적노동'과 같은 것이냐다. 물론 이것은 AI 시대에 한 사람의 노동자로서 어떻게 대응할 것인가에 관한 이야기가 아니다. 이 글은 AI 시대에 인간이 지적 존재로서 의미 있기 위한 조건을 묻는 글이다. 그러니 질문의 방향을 돌려, 인간이 문장을 만들고 하나의 생각을 떠올릴 때, 그 과정은 정말 계산과 다른가? 아니면 그것도 결국 '계산'일까? 잠시 우리 뇌 안을 살펴보자.

우리의 뇌도 계산할 뿐인가: 환원의 역설

막상 우리의 뇌 안에서 벌어지는 일은, 놀랄 만큼 계산과 유사하다는 주장들이 있다. 최근의 한 연구는 사람이 문장을 만들 때 뇌가 위에서 아래로 차근차근 분해한다는 것을 보였다. 단어를 출력하기 직전, 맥락 수준의 표상이 먼저 떠오르고 그 다음 단어, 음절, 글자 수준의 표상이 나타나고, 한동안 유지되면서 중첩된다는 것이다.^[1] 추상적인 의미가 점점 구체적인 단위로 쪼개져 운동 명령까지 내려간다는 이 구조는, LLM이 의미에서 토큰으로 내려와 문장을 짜는 방식과 유사하다.

나아가 뇌가 "예측 기계"라는 주장을 살펴보자. '예측 부호화와 자유 에너지 원리'로도 불리는 이론은, 지각과 인지를 끊임없는 예측과 오차의 수정으로 해석한다. 그런데 LLM에서 트랜스포머^[2]가 '다음 토큰 예측 손실 최소화'라는 단순한 목표로 학습된다는 사실 역시 위 이론과 놀랍게도 유사하다. LLM의 다음 단어 맞추기와 뇌의 작동원리가 같은 수학적 골격을 공유한다는 것이다.^[3] 물론 위 이론은 너무 일반적이라 반증이 어렵다는 비판을 받아왔다.^[4]

그런데 신경과학 이론이 계산 기계로 보는 관점은 환원의 한계를 드러낸다. 먼저, 예측의 구조가 다르다. 뇌의 예측은 가만히 앉아 다음을 맞추는 것이 아니라, 몸을 움직여 세계에 개입하고 그 결과로 자기 예측을 검증하는 능동적 추론이다. 현재의 파운데이션 모델^[5]은 바로 이 행위와 생성모델의 긴밀한 통합을, 그리고 위계적 구성성과 일화 기억을 결여한다. 뇌는 행위를 통해 세계의 닻(anchor)을 내리고 예측을 교정하는데, LLM 그 자체에는 그 행위와 피드백의 루프가 없다. 둘째, 문장의 의미는 단어의 합이 아니다. "개가 사람을 문다"와 "사람이 개를 문다"는 동일한 단어로 이뤄졌지만 뜻이 다르다. 한 fMRI 연구는 좌중상측두피질에서 관계구조를 인코딩하는 영역을 찾아내,^[6] 뇌는 토큰의 선형 나열만 하는 것이 아니라 누가-무엇을-누구에게라는 관계구조를 따로 표상한다는 것을 밝혔다.

여기서 한 가지 역설이 드러난다. 환원은 성공할수록 환원하려던 대상을 바꿔놓는다. 뇌를 예측기계로 환원하는 데 성공할수록, 그 계산이 행위와 신체와 관계구조와 세계의 피드백에 깊이 박혀 있다는 사실이 함께 드러나기 때문이다. 그래서 우리는 다시, 줄곧 '계산'을 산술 정도로 잘못 이해하고 있었다는 깨달음에 도달한다. 튜링이 인간을 말끔히 지워낸 그 순수한 기호 조작에서, 몸을 가진 무언가가 세계에 응답하는 과정으로. 사고가 계산이라는 말은 맞을지도 모른다. 다만 그때의 계산은 튜링의 계산이 아니다.

앞의 두 갈림길에 다시 서보자. 인간의 사고는 계산일 수 있다. 그러나 세계에 닻을 내린 계산이지, 닻 없이 닫힌 튜링기계의 계산이 아니다. 우리에게는 몸이 있고, 그 몸이 세계와 부딪히며 예측을 틀리고 교정한다. 그렇다면, 지금 우리의 옆자리에서 지적노동을 해치워주는 그 기계에도 그런 닻이 있나?

LLM의 가능성과 한계 사이

LLM은 인간처럼 사고하는 걸까? 이에 대한 가장 흔한 대답은 '모방'이다. LLM은 다음에 올 단어의 확률을 고를 뿐인 거대한 앵무새이고,^[7] 그럴듯해 보이는 것은 방대한 흉내의 산물이라는 것이다. 나 역시 오랫동안 그렇게 생각했지만, 좀 곤란한 현상들도 존재한다.

작은 인공 신경망에 모듈러 덧셈^[8]을 시키면, 처음엔 그냥 외운다. 그대로 멈췄다면 아무 일도 없었겠지만, 학습을 지속하면 정말 '어느 순간' 정확도가 치솟는다. 메커니즘을 들여다보면 신경망은 답 외우기를 멈추고, 두 수를 원 위의 회전으로 바꾼 뒤 삼각함수와 푸리에 변환으로 합성해 답을 구하는 알고리즘을 제 안에 채워두고 있었다.^[9] 아무도 가르쳐준 적 없는, 문제풀이에 필요한 법칙을 기계가 스스로 찾아낸 것이다. 연구자들은 이에 'grokking'^[10]이라는 이름을 붙였다. 물론 이는 mod 113 덧셈이라는 toy project에서 벌어진 일이고, 그대로 거대 모델로 일반화할 수 있다는 보장은 없다. 다만 큰 모델 안에서도 단순 암기를 넘어선 내부 구조화가 일어난다는 정황은 꾸준히 쌓이고 있다.

모방이라고 잘라 말하기는 어렵지만, grokking이 보여주는 것은 데이터 안에서 스스로 법칙을 찾아내는 것이지, 세계에 대해 무언가 밝혀내는 일이 아니다. 인공신경망은 세계에 대해 궁금해하지 않는다. 법칙을 찾아내는 일과, 그 법칙이 세계의 이해에 어떤 의미가 있는지 닻을 내리는 일은 다른 차원이다. 전자를 아무리 빠르게 잘해도 후자를 할 수 있는지는 보장되지 않는다.

최근에 떠오르고 동시에 위기를 맞고 있는 API를 부착한 Saas 산업에 관심 있는 분이라면, 요즘 LLM은 닫혀 있지 않다고 할지도 모른다. 검색을 붙이고(RAG), 도구를 호출하고, 매 순간 새로운 맥락을 받아들인다. 화면 너머의 LLM이 세계와 의사소통하는 것처럼 보인다. 그러나 기술적으로 뜯어보면, 세계와의 접촉은 빌려온 것이다.

첫째, 맥락은 입력이지 상태의 변경이 아니다. 검색으로 끌어온 문서든 프롬프트로 넣은 지시든, 그것들은 추론하는 그 순간에 잠깐 활성화될 뿐 모델의 가중치 그 자체를 건드리지 않는다. 대화가 끝나면 그 학습은 사라진다. 둘째, 그 경계를 긋는 것은 언제나 인간이다. 무엇을 검색해서 넣을지, 무엇을 물을지, 언제 멈출지를 모두 사람 또는 사람이 짠 파이프라인이 정한다. 모델은 스스로 세계로 손을 뻗지 않는다. 세계에 무엇을 묻고 그 응답을 어떻게 받아들일지를 모델이 정하지 못하니, 결국 닻을 대신 내려주는 것은 인간이다.

시스템이 열려 보이는 건, 인간이 매 턴 입력을 갈아 끼우며 바깥세계를 떠먹여 주기 때문이다. 사람이 빠지는 순간, LLM은 같은 입력에 같은 분포를 돌려주는 자기 반복으로 닫힌다. LLM의 계는 오직 외부로부터만 흔들린다. 그렇다면 LLM이 스스로를 흔드는 것은 가능한가? 이제 신체와 생명으로 가보자.

스스로 흔드는 닫힘: 신체와 생명

규칙과 기호의 조작으로 인공지능을 구현하려던 시절(이른바 GOFAI), 휴버트 드라이퍼스^[11]는 그 기획이 끝내 실패하리라 보았다. 그는 인간이 세계를 만나는 방식은 언제나 특정한 몸을 지니고 특정한 상황 속에서 일어난다고 봤다. 우리는 망치를 쓸 때 망치의 무게와 길이에 대한 객관적 표상을 머릿속에 펼쳐놓고 계산하지 않는다. 그냥 능숙하게 쥐고 내려친다. 하이데거가 '손에 익음'이라 부른 이 암묵적 숙달은, 명시적 규칙으로 환원되지 않는다. 세계에 대한 앎의 상당 부분은 표상 이전에, 몸이 세계와 부대끼는 자리에 깃들어 있다는 것이다. 기호만 쌓아서는 결코 그 자리에 닿을 수 없다.

마투라나는 한 걸음 더 들어간다. 그에 따르면 외부 세계는 신경계가 곧이곧대로 받아들이는 대상이 아니다.^[12] 신경계는 바깥을 표상해 들여오는 것이 아니라, 외부 자극을 계기 삼아 자기 자신의 상태에 응답할 뿐이다. 다시 말해 생명체도 어떤 의미에서는 닫혀 있다. 자기 내부에서 닫혀, 바깥과 직접 만나지 않는다. 튜링 기계도 물론 닫혀 있다. 입력이 들어오기를 가만히 기다리고, 바깥이 흔들어주지 않으면 동일한 입력에 동일한 출력만 내보낸다. 반면 생명은 자기를 유지하기 위해 끊임없이 환경과 피드백을 주고받고, 그 과정에서 스스로 자기 구조를 바꾼다. 관건은 닫혀 있느냐가 아니라, 그 닫힘을 흔드는 주체가 자기 자신이냐 타자냐의 문제다. 어쩌면 그것이 우리를 의미의 생명으로 만드는, 지적활동의 본질일지도 모르겠다.

다시, LLM은 과연 사고하는가? 그렇게 보기 어렵다. LLM은 스스로의 닫힘을 깨닫고 주체적으로 자기를 고쳐 쓰지 못한다. 데이터의 변화는 LLM에게 위기가 아니라 그저 다음 학습 스텝을 통한 갱신에 불과하다. 위기란 그것을 제 것으로 떠맡을 주체가 있을 때에만 위기인데, 거기엔 떠맡을 주체가 없기 때문이다.

누군가는 금방 해결될 문제라 할 것이다. 가중치를 계속 갱신하고 로봇의 몸을 입혀 세계와 부딪히게 하면 닻이 생기지 않겠느냐고? 모리타가 소개한 로봇공학자 브룩스가 표상 없이 세계와 부딪히는 로봇을 만든 것도, 그러한 노력의 일환이다. 그러나 브룩스의 로봇은 행동은 얻었으되 의지는 끝내 얻지 못했다. 호기심을 가진 학습 에이전트가 스스로 학습할 곳을 찾아간다고 해도, 그 호기심의 목적 자체는 바깥에서 주어진다.^[13] 목적을 스스로 정립할 수 없는 한, 체화도 지속학습도 더 정교한 타자생성^[14]일 뿐이다.

인간도, 특히 근대 이후의 인간은 대개 자신이 거쳐 온 직업, 계급, 역할 등에 의해 떠맡은 목적에 따라 산다.^[15] 무엇을 원할지조차 대체로 바깥이 정해준다. 그런 규정이 흔들리는 위기의 순간에야 비로소 자유를 떠맡는다. 그러니 LLM과 인간을 가르는 것은 의지가 안에서 발생하느냐가 아니다. 위기가 닥쳤을 때 그것을 능동적으로 떠맡는 주체가 되느냐의 문제다. LLM에게 분포의 변화는 진정으로 자율적인, 또는 주체성의 발현의 문제가 아니다. 즉, 문제는 산출능력이 아니다.

사유라는 마지막 성역 찾기

LLM의 지적 산출이 아무리 정교해져도, 그것은 스스로를 흔들 주체 없이, 자기를 고쳐 쓰기 위해선 어떤 형태로든 인간을 경유할 수밖에 없다. 인간의 사고는 설령 계산이라고 해도 세계에 닻을 내린 계산, 자기를 흔드는 계산이다. 그렇다면 LLM이 지적노동을 아무리 잘 해치워도, 우리에게는 기계가 끝내 들어설 수 없는 자리가 남는다. 몸이라기보다는, 자기 존재가 걸린 자리.^[16] 데카르트가 마음 둘레에 쳐둔 그 울타리가, 자리를 옮겨 여기 다시 서 있는 것처럼 보인다.

그렇지만 외부 세계에 닻을 내리는 계산을 한다는 것은 무슨 의미일까? 프레게 이후 우리는 사고를 순수한 형식논리로 표현할 수 있게 되었다. 수학자가 종이 위에서 정의를 따라 증명을 전개할 때, 그 추론의 집행은 분명 형식화된다. 그러나 무한한 타당 추론 가운데 어느 길이 유망한지, 어떤 보조정리가 열쇠인지를 알아보는 감각만은 형식 바깥에 있다. 형식논리는 몸도 상황도 없는 곳에서 성립하지만, 그 형식을 어디로 끌고 갈지는 끝내 그렇지 않다.

추상적 사유라고 다 같은 추상은 아니다. 역사를 해석하고 판결의 정당성을 따지고 시 한 편의 아름다움을 가늠하는 일은 다른 영역이다. 맥락과 가치, 무엇이 문제인지 알아보는 감각과 취향이 결론을 좌우한다. 그러니 신체 없는 기계에 먼저 내어준 것은 추상적 사유 전체가 아니라, 그중 형식화가 가능한, 규칙으로 구성되는 부분이었다. 역으로 이는 위 영역들의 합리성이 형식논리의 강제나 규칙의 집행으로는 다 해석될 수 없음을 방증하는 것일지도 모르겠다. 다만 그 영역에서도, 합리성이 형식적 규칙으로 환원되는 만큼은, 이미 인간만의 것이 아닐지도 모른다.

지금의 AI 시대 담론은 사실 10년 전 떠올랐던 4차 산업혁명이란 담론을 LLM이 증발시켜버린 결과다. LLM이 등장하고 '인공지능'이 육체노동을 먼저 대체할 것이라는 착각은 빠르게 사라졌다. 인간 최후의 보루라던 '자연어'를 구사하던 사무 서비스직이, 사실은 경제적으로나 기술적으로나 대체가 가장 용이한 평지였던 셈이다. 이젠 더 이상 산업용 로봇을 보아도 육체노동의 종말 담론 같은 건 떠오르지 않을 만큼, 후순위 문제가 되어버렸다. 알파고가 이세돌을 꺾었을 때조차, 사람들은 바둑은 내주더라도 범주화를 근간으로 하는 비판적 사유와 추상적 사변만은 인간 지성의 마지막 보루로 남으리라 믿었다. LLM은 불과 몇 년 만에 그 마지막 보루마저 증발시켰다.

그래서 이제는 뭉뚱그려 '사고'라 불러온 것을 둘로 구별해야 할지도 모르겠다. 기계가 해치우는 사고의 산출과 인간 고유의 '사유'로. 그 사유가 무엇인지 가늠하기 위해, 앞서 1장에서 잠깐 스친 비트겐슈타인에게로 돌아가보자. 규칙을 따른다는 것은 머릿속 사적 과정이 아니라 공동체의 실천에 참여하는 일이며, '맞다'와 '틀리다'는 그 실천 바깥에서는 성립하지 않는다. 의미는 기호 안이 아닌, 그것을 쓰고 고치고 책임지는 공동체의 규범적 행위 안에만 존재할 수 있다. 그렇다면 닻이 있는 사유란 추상적 사변이 아니라 실천이 동반된 사유이고, 실천이란 결국 몸을 가진 자가 세계와 타인들 사이에서 수행하는 '무엇'이다. 사유를 사유이게 하는 것은 그 안의 명석함이 아니라, 그것이 세계와 사람들 속에 박혀 있다는 사실인지도 모른다.

그러나 인간 지성의 마지막 고유한 영역이 될지도 모를 '인간의 사유'가 구체적으로 무엇인지는 나도 모른다. 외부 세계에 닻을 내리는 실천적 사유란 무엇일까? 그것은 사변과 어떻게 다르며, 어디서부터가 실천이고 어디까지가 길들여진 반응인가? 위 질문들에 아침에 일어나서 새벽에 잠에 들기 전까지 하루 종일 고민하지만, 아직 답을 찾지도 못했고 잠정적인 가설도 언어로 표현하기 너무나 어렵다. 다만, 기계가 사변의 자리를 가져간 시대에도 인간에게 실천적 사유가 남는다면, 그것이 어떤 모습이어야 하는지 묻는 일만큼은 더 이상 미룰 수 없게 되었다.

각주

[1] Zhang, Pinet et al., "From Thought to Action: How a Hierarchy of Neural Dynamics Supports Language Production" (arXiv:2502.07429, 2025). 숙련 타이피스트 35명을 MEG·EEG로 측정해, 단어 산출에 앞서 맥락·단어·음절·글자 수준 표상이 순차적으로 떠올랐다 가라앉으며 중첩됨을 보였다. (Meta AI의 King 팀이 낸 2025년 프리프린트로, 고전 심리언어학의 위계적 산출 모델과 정합적이나 신생 연구다.)

[2] 트랜스포머(Transformer): 2017년 제안된 신경망 구조(Vaswani et al., "Attention Is All You Need")로, 오늘날 거의 모든 대형언어모델의 골격이다. 핵심은 '셀프 어텐션' — 입력된 토큰들이 서로를 얼마나 참조할지를 가중치로 계산해, 문맥에 따라 각 단어의 표상을 동적으로 재조합한다. 문장 전체를 병렬로 처리해 장거리 의존 관계를 효율적으로 포착하며, 이 병렬성이 대규모 학습을 가능케 했다.

[3] Friston, K., "The free-energy principle: a unified brain theory?" (Nature Reviews Neuroscience, 2010); 뇌의 예측 위계와 GPT-2를 직접 견준 Caucheteux & King, "Evidence of a predictive coding hierarchy in the human brain listening to speech" (Nature Human Behaviour, 2023); next-token prediction을 예측 부호화의 한 형태로 명시한 Rao et al.(University of Washington), "Lessons from Neuroscience for AI" (arXiv:2512.22568, 2025) 참조. 라제시 라오는 예측 부호화의 고전적 모델(Rao & Ballard, 1999)을 제안한 분야의 창시자급 인물이다.

[4] 자유 에너지 원리에 대한 대표적 비판으로 그 일반성·반증 가능성을 문제 삼는 논의들이 있다(예: Colombo & Wright, "First principles in the life sciences", 2018). 원리가 사실상 모든 적응적 행동을 사후적으로 설명할 수 있어 경험적 반증이 어렵다는 지적이다.

[5] 파운데이션 모델(Foundation Model): 방대한 데이터로 대규모 사전학습한 뒤 다양한 하위 과제에 적응시키는 범용 기반 모델(Bommasani et al., 2021, 스탠퍼드 HAI 명명). GPT·Claude 같은 LLM이 대표적이며, 하나의 거대한 사전학습 모델을 토대(foundation) 삼아 여러 응용을 얹는 패러다임을 가리킨다.

[6] Frankland & Greene, "An architecture for encoding sentence meaning in left mid-superior temporal cortex" (PNAS, 2015). 두 차례의 fMRI 실험(MVPA)으로 좌중상측두피질(lmSTC)이 '누가 누구에게 무엇을 했는가'를 유연하게 인코딩함을 보였다. 행위주/피행위주의 의미적 관계 구조가 단어 정보와 별도로 표상된다는 증거다.

[7] '확률적 앵무새(stochastic parrots)'라는 표현은 Bender, Gebru, McMillan-Major & Shmitchell, "On the Dangers of Stochastic Parrots: Can Language Models Be Too Big?" (FAccT 2021)에서 나왔다. LLM이 의미 이해 없이 학습 데이터의 언어 형식을 통계적으로 꿰맞출 뿐이라는 비판으로, 이후 LLM 회의론의 대표적 구호가 되었다.

[8] 모듈러 덧셈(modular addition): 일정 수로 나눈 나머지로 답을 내는 덧셈. 해당 실험은 113을 법(法)으로 하는 덧셈, 즉 a+b를 113으로 나눈 나머지를 맞히는 과제였다(예: 110+5=115 → 2). 시계가 12를 넘기면 1로 돌아오는 것과 같은, '원 위의 덧셈'이다.

[9] Nanda, Chan, Lieberum, Smith & Steinhardt, "Progress measures for grokking via mechanistic interpretability" (ICLR 2023, arXiv:2301.05217). 1층 트랜스포머를 역공학한 결과, 입력 두 수를 원 위의 회전으로 임베딩하고 이산 푸리에 변환·삼각함수 항등식으로 회전을 합성해 mod 덧셈을 푸는 알고리즘이 내부에 형성돼 있었다. 학습은 '암기 → 회로 형성 → 암기 성분 제거'의 세 단계를 거쳤다.

[10] grokking: 본래 로버트 하인라인의 SF 소설 《낯선 땅 이방인》(1961)에서 만들어진 말로, 무언가를 완전히·직관적으로 체득해 자기 일부로 만든다는 뜻이다. 머신러닝에서는 모델이 한참 암기에 머물다 갑자기 일반화 능력을 획득하는 현상을 가리킨다.

[11] GOFAI(Good Old-Fashioned AI): 철학자 존 호글랜드가 명명한 표현으로, 기호와 명시적 규칙의 논리적 조작을 통해 지능을 구현하려던 고전적 인공지능 패러다임을 가리킨다. 1950~80년대 AI 연구의 주류였으며, 인간 지능을 규칙의 집합으로 환원할 수 있다는 전제 위에 서 있었다.

[12] 움베르토 마투라나·프란시스코 바렐라, 《앎의 나무》(El árbol del conocimiento, 1984). 마투라나는 생명체를 외부를 표상하는 체계가 아니라 자기 조직을 유지하며 작동하는 닫힌 체계로 보았다(자기생성). 신경계는 외부를 그대로 들여오는 것이 아니라 자기 상태의 변화로 자극에 응답하며, 그 과정에서 세계를 '생성'한다고 보았다(구조적 짝지음).

[13] 내재적 동기(intrinsic motivation)·호기심 기반 강화학습은 외부 보상이 희소한 환경에서 에이전트가 스스로 보상 신호를 만들어 탐색하게 한다. 오데예 그룹의 CURIOUS(Colas et al., ICML 2019)처럼 에이전트가 스스로 목표를 설정하고 자기 커리큘럼을 짜는 '개방형 학습'까지 제안되었다. 그러나 그 호기심·목표 설정의 메커니즘과 목적함수 자체는 여전히 설계자가 외부에서 부여한다. 인간이 어떤 목표를 추구하고 가치 있게 여길지를 스스로 정하는 것과 달리, 현재의 시스템은 과제별 목적의 틀을 바깥에서 받는다는 한계가 지적된다(Oudeyer 등).

[14] 타자생성(allopoiesis)은 마투라나·바렐라의 자기생성(autopoiesis)에 대비되는 개념이다. 자기생성이 체계가 스스로 자신을 만들고 유지하는 것이라면, 타자생성은 그 체계를 만들고 갱신하는 힘이 바깥에 있는 경우를 가리킨다. 공장이 제품을 찍어내지만 그 공장 자체는 외부가 설계하고 고쳐주듯, LLM도 산출은 하되 자기를 바꾸는 손은 늘 바깥(설계자·데이터)에 있다.

[15] 이는 사회학자 피에르 부르디외의 아비투스(habitus) 개념에 기댄 서술이다. 아비투스란 개인이 놓인 사회적 위치(계급·직업·교육 등)가 몸과 성향에 새겨져 형성된 지각·판단·행위의 체계를 말한다. 그 핵심은 아비투스가 '구조화된 구조(structure structurée)'이자 동시에 '구조화하는 구조(structure structurante)'라는 이중성에 있다. 한편으로 그것은 사회 구조가 개인에게 각인된 결과물이지만(수동적으로 구조에 순응), 다른 한편으로 그것은 개인의 실천을 산출함으로써 그 구조를 다시 재생산하는 발생 원리이기도 하다(능동적으로 구조를 재생산). 본문에서 '무엇을 원할지조차 바깥이 정해준다'고 한 것은 이 점을 가리킨다.

[16] 여기서 '자기 존재가 걸렸다'는 것은 단순히 물리적 몸을 가졌다는 뜻이 아니다. 자율주행차도 센서와 바퀴라는 몸으로 세계와 부딪히고 충돌을 회피하지만, 그 회피는 자신의 소멸을 두려워하는 데서 나오지 않는다. 몸의 유무가 아니라, 그 몸에 자기 존재가 걸려 있느냐가 관건이다.

저작자표시 비영리 변경금지 (새창열림)

'Readings' 카테고리의 다른 글

김지원, 『지금도 책에서만 얻을 수 있는 것』: 지금도 책 읽기가 취미인 까닭 (3)	2025.07.15
박준영, 『반도체를 사랑한 남자』: 기술과 노동 유연화에 대한 다른 상상 (0)	2025.04.05
박형서, 『낭만주의』: 투명하게 표현되는 SF 소설 (0)	2025.03.01
김영란, 『판결 너머 자유』: 우리 사회는 분열사회에서 공존사회로 이행하고 있는가 (2)	2025.01.04
알랭 쉬피오, 『숫자에 의한 협치』: 수치의 객관성이라는 허상 (1)	2022.09.18