Is Nature Probable or Capricious? (R. Lewontin, 1966)

다음은 르원틴의 옛날 글을 예전에 번역했던 것이다. 번역한 내용을 웹에 뿌리는 것에 대해서는 자신이 없다. 그러니 읽는 분도 주의하시기를.


Is Nature Probable or Capricious? by R. Lewontin (1966)
자연은 확률적인가 또는 변덕스러운가?

종종 무시되지만 근대 과학사에서 가장 중요한 사건은 아마도 1637년 데카르트의 <<방법서설>>의 출간일 것이다. 특히 그가 제 5 부에서 동물을 기계로 비유한 부분이 중요하다. 데카르트의 이 bête machine, 즉 동물기계론은 곧이어 라 메트리(La Mettrie)에 의해 home machine, 즉 인간기계론으로 확장되었고, 그 이후의 과학을 성격짓는 세계관의 기초가 되었기에, 근대 지식체계를 데카르트식 체계라고 말해도 과언이 아닐 것이다. 우주가 한 거대한 기계라는 개념은 곧 모든 결과에는 원인이 존재한다는, 즉 우주가 결정적(deterministic)이라는 뜻이다. 다르게 말하자면, 특정 시점 t0에 관련된 모든 변수의 상태가 주어진다면, 어떤 미래 시점 t1의 우주의 상태를 정확히 예측할 수 있다는 뜻이다. 결국 우주는 수많은 미분방정식들의 해 다름 아니다. 이 세계관은 물리, 화학 그리고 생리학의 엄청난 발전의 기초가 되었을뿐만 아니라, 심리학과 같이 새롭게 시작하는 과학의 시작점이기도 하다. 우리는 항상 정확한 예측들을 가능케 하는 엄밀한 법칙들을 발견할 수 있을 것이라는 희망과 가정으로 시작하지 않는가.

재밌게도 데카르트가 죽은 1650년은 기계론과 엇갈릴 또다른 세계관의 기초가 놓인 해이다. 이 세계관은 그 이후 200년이 넘는 기간동안 그 진가를 전부 드러내지 못할 터였다. De alea geometriae[1]에 서, 파스칼, 페르마 그리고 호이겐스는 결정론과는 다른 우주관을 고안했는데, 바로 우주는 주사위판이며 던진 주사위의 결과에 따라 결정이 된다는 비유였다. 물론 인간사의 결과가 우연의 결과라는 생각 자체는 매우 오래된 것이다. 결정적인 순간에 Alea jact est (주사위는 던져졌다)를 말을 한 첫 사람이 카이사르는 아닐 것이다. 그러나 우연을 체계화시켜 한 이론으로 만든 것은 파스칼과 페르마이며, 그 수학화는 베르누이와 그 이후 라플라스에게 공을 돌려야할 것이다.

그 시작에도 불구하고, 과학에 있어 데카르트주의의 그늘은 심지어 이 확률이론의 창시자들조차 그 비결정적인 함의를 받아들이지 못하게 만들었다. 라플라스는 그의 Essai philosophique sur les probabilities(A philosophical essay on probability)에서 우연한 사건과 결정론적 우주 사이의 모순을 무지의 원칙을 통해 해결하고자 했다. 사건들이 우연에 의해 일어나는 것처럼 보이는 이유는 우주가 엄청나게 복잡해서 우리가 연관된 모든 사실들을 아는 것이 불가능하기때문이라는 것이다. 만약 주사위를 던지는데 가해지는 정확한 힘과, 주사위의 모양, 주사위판의 성질들 등등 주사위의 모든 중요한 정보들을 알아낼 수 있는 악마가 있다면, 그 악마는 주사위를 던졌을 때 그 결과를 정확히 예측할 수 있을 것이다. 즉, 라플라스를 따르자면, 우주는 여전히 인과율하에 있지만, 사람의 무지와 오류때문에 정확한 예측을 하는 것이 불가능한 것이다.

물리학에서 확률 개념을 응용한 최초의 중요한 예는 19세기 맥스웰과 볼츠만에 의해 발전한 기체 운동론이었다. 허나 라플라스와 데카르트주의의 영향때문에 이 경우에도 분자 수준에서도 엄격한 결정론이 적용된다는 가정은 유지되었다. 단지 우리가 분자들을 구분할 능력이 없기 때문에, 결정론적인 체계로부터 실제로는 확률론적인 체계가 도출되는 것이다. 이 점에서 맥스웰의 악마와 라플라스의 악마에는 큰 유사점이 있다고 할 수 있겠다.

우연이란 개념이 갖고있는 형이상학적인 함의들을 물리학에서 전적으로 고려하게 된 것은 20세기가 되고 나서부터였다. 양자역학은 그 근본부터 反유물론적이고 反데카르트적이다. 양자역학에 따르면 사건들이 확률적으로 일어나는 것은 우주의 기본적인 성질이다. 불안정한 핵의 정보에 대해 아무리 많은 정보가 주어진다고 하더라도, 원칙적으로 이 핵이 언제 붕괴할지 결정할 수가 없다. 즉, 실제로 붕괴가 일어난 그 순간까지, 붕괴한 핵과 그 이웃 핵 사이에는 그 어떠한 차이도 없다. 오로지 기술할 수 있는 것은 특정 기간에 전체 중 얼마만큼의 부분이 붕괴할 것이냐라는 점뿐이다. 라플라스와 맥스웰이 상정했던 악마들은 사실 존재하지 않는다. 슈뢰딩거와 하이젠베르크는 그들의 존재를 반증했다.

여기서 결정론의 역사와 그 최종적 실패를 논의한 이유는 한 단계 더 나아가 확률에 지배받는 우주라는 말조차 특정 현상에서는 너무 확실한 것이 아니냐는 물음을 제기하기 위해서이다. 하지만 이런 문제제기는 일견 모순처럼 보인다. 어떤 것이 우연보다 덜 확실할 수 있단 말인가? 이를 이해하기 위해서는 확률론의 기본 공리, 대수의 법칙(The law of large numbers)과 통계정보의 의미에 대해 살펴볼 필요가 있다.

대수의 법칙을 기술하는데는 여러 방법이 있는데, 그 중 한 가지를 살펴보자. 어떤 확률변수의 (표본) 평균값들은 그 확률변수의 참평균값 주위의 일정 구간 안에 대개 분포하는데, 이 때 표본값들의 개수가 점점 커지면 표본평균값들이 분포하는 구간의 범위도 점점 좁아진다는 것이 대수의 법칙(의 한 표현)이다. 표본집단이 커지면 커질수록, 우리가 관측하고 있는 평균값이 참값에 점점 더 가까워지는 것은 점점 확실해진다. 이 법칙은 서로 다른 분포들의 결합같은 경우를 포함해서 매우 다양한 경우에 들어맞고, 확률론에서 가장 기본적인 공리라고 할 수 있을 것이다. 대수의 법칙을 적용한 예는 [그림 1]에 있다. 무작위로 50개의 수를 뽑아서 처음에는 첫번째 값, 다음에는 첫번째와 두번째값, 그 다음에는 첫번째에서 세번째값, 이런 식으로 나가 마지막에는 50개 수 전부의 평균값들을 계산했다. 그리고 각각의 평균값들은 표본값의 개수를 한 축으로 해서 실선으로 나타냈다. 두 실선은 50개의 수의 배열방법을 각기 달리한 경우 계산한 평균값들이다. 여기서 우리는 표본집단의 크기가 작은 경우에는 진정한 참평균 5로부터 표본값의 평균이 크게 차이가 나지만, 표본수가 많아질수록 그 평균값이 참평균값에 근접하는 것을 볼 수 있다. 또한 오랜 기간에 걸쳐서 누적평균값이 참값보다 큰 채로 또는 작은 채로 유지되는 것을 볼 수 있다. 마지막으로 또 숫자들을 어떤 순서로 배열하느냐는 표본값이 커짐에 따라 의미를 잃어가며 당연히 모든 50개의 값들이 포함되면 서로 같아진다는 것을 볼 수 있다.

많은 확률변수들도 앞서 본 평균값들(그리고 확률)의 행태를 따르지만, 모든 확률분포가 일반적으로 위와 같은 모습을 보이는 것은 아니다. 유명한 예로 코시분포를 들 수 있다. 이 분포는 겉보기에는 정규분포와 비슷하게 생겼지만, 큰 편차를 보이는 관측값이 나올 확률이 좀더 높다. 바로 이 분포에서 잘 알려져있는 사실은, 이 분포로부터 취한 한 관측값과, 백만개의 관측값으로부터 평균한 추정치가 참값으로부터 비슷한 편차를 보인다는 것이다. 즉, 코시 분포를 따르는 표로부터 무작위 수를 뽑았을 경우, [그림 1]은 중앙으로 근접하는 실선대신 x축을 따라 계속 출렁거렸을 것이다. 다른 식으로 말하자면, 코시분포로부터 얻은 단 하나의 관측치는 백만개의 표본과 참평균값에 대해 같은 수준의 정보를 갖고 있다는 뜻이다. 대수의 법칙을 이런 정보관점에서 달리 기술하자면 표본평균이 갖고 있는 참평균값에 대한 정보가 표본이 커짐에 따라 참평균값에 대한 완벽한 정보수준에 근접해간다는 것이다[2].

표본이 갖고 있는 정보량이라는 개념을 갖고 이제 결정론과 우연의 질문으로 돌아갈 수 있다. 결정론적 시스템에서는 적어도 이론상 어떤 사건이든 그 사건이 일어났을 때의 우주의 참상태에 대한 완벽한 정보가 있다. 확률론적 시스템에서는 유한한 수의 관찰로는 불완전한 정보밖에 없지만, 이 정보값은 표본크기가 증가함에 따라 완전에 가까워진다. 나는 여기서 한 시스템이 변덕스럽다라는 것을, 이에 대해 완전한 정보를 얻을 수 없고 (대개의 경우 전혀 정보가 없다) 반복적으로 그 사건을 수집해도 그 시스템에 대한 정보량이 증가하지 않는 경우로 정의하고자 한다. 대수의 법칙은 결코 잊는 법이 없는 측정장치가 이용하는 법칙이다. 즉, 평균값을 계산하는데 더 많은 정보가 사용될수록 측정장치는 참값에 근접한다. 하지만 과거의 값들을 잊어버리는 측정장치는 어느 순간 입력되는 정보량과 잃어버리는 정보량 사이에 균형에 이르러 완벽해질 수 없다. 이러한 측정장치에 있어서 우주는 영원히 변덕스러운 채로 남아있을 것이다. 잊어버린 사건들의 반복들은 영원히 예기치 않은 결과를 낳을테니까.

자, 이제, 유기체를 우주의 측정장치들로 바라보자면, 이들은 유한한 기억용량을 갖고있기에 각 개체들은 환경의 변덕에 노출되어버릴 수 밖에 없다. 이는 개체군과 종들의 경우도 마찬가지다. 진화상 적응하는 과정을 미래의 환경을 예측하기 위해 과거 환경의 정보를 획득하는 과정으로 본다면, 이는 결코 완벽할 수 없고 그래서 진화도상의 개체군이나 종들에게 있어 환경은 항상 변덕스러울 것이다. 개체군들이 기억하는 기작이 대수의 법칙보다 약할 수 밖에 없다는 점을, [그림 1]에서 이용한 난수들을 이용해서 진화과정을 모사함으로써 보이고자 한다. 여기서 한 유전자에 두 개의 대립형질 aA이 있으며, 둘 중 어느 것도 상대에 우성이 아니라고 가정하자. 또한 자연선택과정이 선호하는 대립형질이 경우에 따라 a거나 A라고 하자. 자연선택의 강도는 우리의 난수가 참평균 5로부터 떨어진 정도에 해당된다고 하자. 이 때 간단한 공식으로 특정 세대에 대립형질 a의 개체군 내 비율을 그 전 세대의 비율과 그 세대의 자연선택의 강도로부터 도출할 수 있다. [그림 2]는 선택압이 변하는 상황에서 개체군 내의 유전자의 비율의 변화의 양상을 보여준다. 십자가 표시는 각 세대별 선택압의 강도를 뜻한다. 실선은 50세대 동안 이와 같이 변하는 선택압에 맞추어 변화한 대립형질 a의 비율을 보여준다. 점선은 똑같은 선택압을 반대 순서로 받은 또다른 개체군의 대립형질의 변화양상을 보여준다. 우리는 이 그림에서 두 개체군의 최종 대립형질의 비율이 약간 다르며, 매우 다른 경로로 이 종점에 도달했다는 것을 확인할 수 있다. 하지만 더 중요한 점은, 이들의 평균적인 반응이 전혀 달랐다는 점에 있다. 실선으로 기술한 개체군의 50세대 동안 평균 대립형질의 비율은 대략 0.38인데 비해, 점선의 경우 0.57이다. 더해서, 시간에 따른 대립형질 비율의 변동폭은 점선이 실선보다 훨씬 크다는 것을 확인할 수 있다.

유전자 비율의 변화는 과거 환경과 단순한 관계를 갖지 않는다. 만약 과거 환경들이 줄곧 한 방향으로 선택압이 작용했다면, 유전자 비율은 한 극단에 가서 (50세대 중 실선의 개체군이 겪었던 중간 정도 지점) 최근 환경에 매우 무감해지고 반응하지 않을 것이다. 실선으로 나타낸 개체군의 경우 중간 세대를 지나면서 거의 모든 세대에서 선택압이 평균보다 큰 방향으로 나왔는데도 불구하고 (십자가 표시 참조) 낮은 비율의 대립형질 비율을 유지하는 것이다. 반면에 잘 드러나지 않았지만, 점선으로 나타낸 개체군은 유전자비율이 중간값에 머물러있기때문에 최근 환경에 더 많은 정보를 갖고 있고 과거 환경에 대한 정보는 적다.

일반적으로, 자연선택의 동역학에 따르면 유전자의 대립형질 비율은 먼 과거의 환경에 대해서는 거의 또는 전혀 정보를 갖고 있지 않으며, 거의 대부분 오래지 않은 과거와 최근의 선택의 결과이다. 그렇다면 개체군의 유전적 구성은 세대의 길이와 비교해서 매우 긴 주기나 매우 짧은 주기의 환경변화에 반응하기 어렵다. 매우 빠른 변동들에 대한 정보는 생리적인 항상성 기구들에 저장할 수 있을 것이다. 그러나 긴 주기를 갖는 환경 변화는 그 일이 얼마나 자주 일어났던 간에, 변덕스러운 영향으로 받아들여질 것이다.

마지막으로, [그림 2]는 진화의 역사성을 예시하고 있다. 한 개체군의 평균적인 유전적 구성은 환경들의 정적인 확률분포뿐만 아니라, 역사적으로 어떤 순서로 일어났느냐에 따라 달라질 것이다. 환경들이 평균이나 다른 변이와 관련해 대수의 법칙을 따른다고 하더라도, 개체군의 적응에 있어서 환경이 어떤 순서로 바뀌었는지가 중요하다면, 일종의 특수성이 가미되는 것이다. 그렇기에, 다시 반복하자면, 개체군과 종들에 있어서, 정보는 제한되어 있고 자연은 변덕스럽다.

fig1

[그림1] 서로 다른 무작위 수 (평균 5인 확률변수로부터 비롯됨)의 누적평균. y축: 누적평균, x: 표본수. 실선은 똑같은 50개의 수의 순서를 달리한 경우. 점선은 다른 무작위수를 순서만 달리한 경우.

fig2

[그림2] 변화하는 환경(x)하에 유전자비율(q)의 변화. x표시는 환경값(선택강도)임. 실선: x표시로 나타낸 환경값에 따라 유전자비율의 변화양상. 점선: 똑같은 환경값을 순서만 반대로한 경우 유전자비율의 변화양상.

[1] 역주: 찾아본 바로는 실제로 출간하지는 못한 것 같음. 페르마와 파스칼 사이에 오고갔던 확률이론과 관련된 내용을 집대성하려고 했었던 듯. 관련 Reference.
[2] 약한 형태의 대수의 법칙

This entry was posted in Text Revisited and tagged , . Bookmark the permalink.

Leave a Reply

Your email address will not be published. Required fields are marked *