중화사전망 - 격려 격언 - 지능 시대에 대한 고찰-기계적 사고와 빅 데이터 사고
지능 시대에 대한 고찰-기계적 사고와 빅 데이터 사고
고등학교 때는 철학 수업이었고 기계적인 사고를 배웠던 기억이 납니다. 나는 잘 기억나지 않는다. 단지 기계라는 것만 알고, 기계처럼 유연한 사고방식을 이해하지 못한다. 오군의 책을 보고 나서야 기계적 사유가 뉴턴의 운동학 3 법칙, 아인슈타인의 상대성 이론 등 매우 높은 수준의 사고 방식이었다는 것을 알게 되었다. 모두 기계적 사고의 결과라고 할 수 있다. 또 다른 돌파구가 아닐까요?
대체로 기계적 사고는 고대 그리스에서 기원했다. 유럽이 과학에서 선두를 차지할 수 있는 유일한 이유는 고대 그리스가 세운 사변적 사고와 논리적 추리 능력에 있다. 중국에서는 춘추시기를 제외하고 제자백가쟁명, 배후의 주요 사상은 유가와 도가 문화를 위주로 한다. 유가는 중용, 중립, 중용, 균형, 사람 위주의, 사변은 극단적인 사고방식과 추구를 중시한다. 도가 사상은 도법의 자연, 천인의 조화, 음양의 균형, 음양의 오묘함을 추구한다. 도의 추구는 도도하고 비범하며, 이름은 매우 유명하다. 즉, 변하지 않는 도는 말로 표현할 수 없다는 것이다. 요약하면, 제 의견으로는, 우리 중국의 선조들은 이미 세계가 매우 복잡하다는 것을 알게 되었습니다. 유가는 자비의 관점에서 사람을 배려하는 것이 더 많고, 도리는 사람과 자연의 조화에 더 관심이 있고, 천지를 스승으로 삼고, 스승을 모시고, 스승을 모시고, 스승을 자연스럽다.
우 선생님의 책에서 기계적 사고에 대한 개요는 다음과 같습니다.
제 생각에는 대부분의 사람들이 이런 사고방식을 가지고 있을 수도 있고, 또 한 가지 사고방식은 존재하지 않을 수도 있습니다. 즉, 맹목적으로 일을 하는 것이 기계적인 사고방식보다 못하다는 것입니다. (존 F. 케네디, 생각명언) 기계적 사고의 핵심 사상은 세계가 완전히 인식할 수 있고, 일정한 법칙이 있으며, 세계 만물 사이에는 일정한 인과 관계가 있고, 법칙에 대한 탐구에는' 대담한 가설과 세심한 검증' 이 필요하며, 지금도 과학적인 태도와 과학적 사고 방식으로 여겨진다. 아인슈타인의 질능 방정식을 포함한 근대의 많은 성과는 모두 기계적 사고의 모드에서 완성되었다.
기계적 사고는 세계가 확실하고 인식될 수 있는 긍정적인 측면에도 한계가 있다고 생각한다. 즉 불확실성과 지성을 부정하는 것이다. 아인슈타인은 "신은 주사위를 던지지 않는다" 는 명언을 가지고 있는데, 이것은 아인슈타인이 양자역학의 발명가인 볼과 논쟁할 때 한 말이다. 오늘 우리는 볼이 이 논쟁에서 옳다는 것을 알고 있다. 아인슈타인은 틀렸고, 하느님도 주사위를 던졌다.
주식시장의 전문가 예측에서 일기예보, 간단한 주사위 던지기에 이르기까지 많은 예측이 정확하지 않다. 불확실성은 어디에서 오는가:
첫째, 우리가 더 자세히 알수록 세계에 영향을 미치는 변수가 많아져서 결과는 간단한 방법이나 공식으로 계산할 수 없다. 트랜잭션에 영향을 미치는 모든 변수를 소진하는 것은 물론 예측할 수 있지만 실제로는 불가능하며 수식은 복잡하여 간단한 공식으로 명확하게 설명할 수 없습니다. (데이비드 아셀, Northern Exposure (미국 TV 드라마), 성공명언)
둘째, 우리의 주관적인 사고의 영향으로, 우리의 세계에 대한 인식은 사고방식의 한계로 인해 정확하지 않으며, 이는 또한 세계에 대한 우리의 인식을 가로막는다.
셋째, 객관적으로 세계는 원래 복잡하다. 예를 들어, 우리는 전자가 원자핵 주위를 빠르게 돌고 있다는 것을 알고 있지만, 특정 순간에 전자의 위치와 속도는 불확실합니다. 이것은 원자 자체의 특성이며, 양자의 불확실성 원리와 유사하며, 우리의 측정 활동 자체가 측정 결과에 영향을 미칩니다. 이것은 우리가 주식시장에서 특정 지수에 따라 주식을 사는 것과 비슷하다. 만약 모두가 이 지수에 따라 주식을 산다면, 이런 스스로 주식을 사는 행위는 주식 자체의 가격과 시세에 영향을 줄 것이다.
세상은 불확실하지만 알 수 없는 것은 아니다. 원자핵을 둘러싼 전자의 움직임이기도 하다. 비록 우리는 전자의 구체적인 위치와 속도를 알지 못하지만, 우리는 그것들이 나타나는 위치와 확률을 추정할 수 있다. 그래서 특정 공식으로 묘사하기 어려운 세계의 많은 것들이 확률 모델로 묘사될 수 있다. 천재 향농은 세계의 불확실성과 정보를 연결시켜 정보론을 형성했는데, 정보론은 일종의 전파 이론일 뿐만 아니라 사람들이 세계를 인식하는 새로운 방법이기도 하다.
정보론이 먼저 해결하는 것은 정보의 양이 얼마나 되는가이다. 내일 해가 동쪽에서 뜬다'' XXX 스타와 XXX 스타가 비밀리에 결혼을 등록했다' 는 두 가지 간단한 문장으로 정보량이 많다. 우리의 직관적인 사고방식으로 볼 때, 내일 해가 동쪽에서 떠오른다는 것은 거의 판에 박힌 일이기 때문에 정보 함량이 없는 쓸데없는 말에 해당한다. 후자의 확률은 비교적 낮기 때문에 정보량이 많다. 향농 박사는 정보를 사건 확정의 불확실성과 연결시켜 엔트로피라는 개념을 도입했다. 엔트로피는 처음에 열역학의 개념이었다. 두 용기는 베젤로 분리되고 양쪽의 가스는 질서 정연한 상태에 있다. 베젤을 제거하면 기체 상태가 점점 무질서해지고 거시적으로 안정될 것이다. 이 기체는 원래의 질서 상태에서 무질서한 상태로 점차 바뀌고 있으며, 엔트로피는 계속 증가하고 있다. 즉, 질서 정연한 결정의 엔트로피가 낮고 무질서한 엔트로피가 높다는 것이다. 엔트로피가 낮거나 사물이 질서 정연해야 한다면 외력이 있어야 한다.
아직도 약간 추상적입니다. 간단한 예를 들어, 만약 너의 방이 정리되지 않는다면, 앞으로는 점점 더 어지러워질 것이다. 이때 엔트로피가 점점 커지고 있다. 한참 찾아도 꼭 찾는 것은 아니다. 왜, 혼란으로 불확실성이 증가했기 때문에, 방을 정리하고, 질서를 높이고, 엔트로피를 낮추는 것이다.
섀넌 박사는 엔트로피를 사용하여 정보의 양을 측정합니다. 정보의 양이 많을수록 불확실성이 커지기 때문에 엔트로피도 커진다. 정보를 확정하려면 더 많은 정보를 도입해야 한다. 가져올 정보의 양은 필요한 이벤트의 불확실성에 따라 달라집니다. 기계적 사고와는 반대로 정보론은 불확실성에 기반을 두고 있다.
기계 학습을 배운 적이 있다면 의사 결정 트리 알고리즘에 익숙해야 합니다. 배운 적이 없어도 괜찮아요. 수박이 익은 수박인지 아닌지를 판단하는 방법에 대한 간단한 예를 들어 보겠습니다. 우리는 오이의 꽃무늬 색깔이 짙고, 과티의 두께, 그리고 호박을 두드리는 소리를 판단할 필요가 있다. 우리는 다음 그림과 같이 이러한 조건에 따라 단계별로 판단하고, 각 단계에서 하나의 조건을 선택하여 판단하고, 마지막으로 여러 조건에 따라 오이가 성숙할 확률을 판단할 수 있습니다.
우선, 우리는 호박이 익었는지 확실하지 않다. 어떻게 우리가 오이의 꽃무늬 색상, 꽃자루의 두께, 판단 조건의 도입 순서 등 많은 정보를 도입했는지 확인하는 것도 중요하다. 예를 들어, 나는 멜론의 꽃무늬 색채가 매우 중요하다고 생각하는데, 이 정보량은 비교적 크다. 도입 후, 익숙하지 않은 정보 엔트로피가 급속히 낮아져 정보에 대한 확신이 점점 더 커지고 있다. (윌리엄 셰익스피어, 햄릿, 지식명언) 이 원리는 의사 결정 트리를 판단하는 데 사용됩니다. 무늬의 색깔과 과티의 두께는 무작위로 선택된 것이 아니라, 선택할 정보는 오이의 성숙과 관련이 있다 (정보론에 따라). 정보론의 상호 정보는 상관관계의 크기를 설명한다.
정보론의 중요한 원칙은 알 수 없는 사건에 대한 확률 모델을 찾아야 할 때, 이 모델은 우리가 이미 가지고 있는 데이터를 만족시켜야 하지만, 알 수 없는 것에 대해서는 어떠한 가정도 하지 않는다는 것이다. (알버트 아인슈타인, 지식명언) 이것이 바로 최대 엔트로피 원리로, 이전의' 대담한 가설, 신중한 논증' 과는 다르다. 주관적인 가정을 하지 않는 전제는 충분한 데이터가 있다는 것이다.
먼저 큰 데이터의 세 가지 특징을 이해해야 합니다. 1) 데이터 양은 충분히 커야 합니다. 2) 데이터의 차원이 충분해야합니다. 3) 데이터가 완전하고 완전히 덮이면 샘플링할 수 없습니다.
이 세상의 본질은 불확실한 세계이다. 우리가 아는 정보가 많을수록 불확실성을 쉽게 없앨 수 있다. 빅데이터가 발전함에 따라 많은 인공지능 문제를 해결할 수 있다. 왜냐하면 우리의 데이터는 충분히 크기 때문이다.
만약 데이터의 양이 충분하다면, 우리는 충분한 정보를 가질 것이다. 관련 분야의 불확실성이 많이 감소할수록 관련 연구의 진척이 빨라진다. 데이터의 차원이 많을수록 우리가 해결하고자 하는 문제와의 관련성이 더 좋다. 다차원 정보로 상호 검증을 수행하여 정보의 불확실성을 더욱 낮출 수 있습니다. 데이터 무결성은 작은 확률 이벤트가 발생하는 것을 방지하며 이벤트가 발생하는 환경의 전체 범위를 포괄합니다. 기술의 발전으로 데이터 수집의 완전성을 가능성이라고 부를 수 있다.
빅데이터는 인과관계가 아니라 상관관계를 강조한다. 세계가 불확실하기 때문에, 우리는 일부 법칙에서 인과관계를 찾을 수 없지만, 영화대여 사이트에 간식광고를 던지는 것과 같은 관련성을 찾는 것을 방해하지 않는다. 예를 들면 커피 평론과 판매 사이트에 신용카드 광고와 주택 융자 광고를 넣는 것과 같다. 인과관계는 모르지만 빅데이터 공유 광고를 클릭해서 얻은 결과다. 하지만 이런 상관관계는 우리가 광고의 조회수를 높이는 데도 도움이 된다. 우리는 원인을 모르는 상태에서 이 답안을 받아들이는 것을 배워야 한다. 만약 우리가 받아들이고자 한다면, 우리는 기계적인 사고방식에서 벗어나 인과 관계만 추구할 것이다.
빅 데이터 시대가 이미 도래했다. 우리의 사고방식은 기계적 사고에 익숙한 방식으로만 생각하는 것을 멈추고, 인과가 없는 답안을 과감히 받아들여야 한다. (존 F. 케네디, 생각명언)
여러분 모두 사고를 높이시길 바랍니다.
-익명은 2009 년 8 월 3 1 일 청두에 있다.