본문 바로가기
카테고리 없음

Embodied Cognition for Autonomous Interactive Robots

by Poblor(파블러) 2013. 11. 23.
반응형

 

체화된 인지의 개념을 대화형 자율 로봇공학에 적용시키자는 고찰 논문입니다.

 

Embodied Cognition for Autonomous Interactive Robots

Guy Hoffman

 

Abstract

과거에는, 체화의 개념이 주로 아주 간단한 로봇의 영역에서 로봇에 적용되어져왔다. 그리고 동역학과 네비게이션 같은 낮은 수준의 메커니즘을 지지하였다. 대조적으로, 가장 인간과 유사한, 대화형, 사회적으로 숙달된 로봇 시스템은 체화를 외면하고 비양태, 기호, 그리고 인지와 상호작용을 위한 모듈적 접근을 사용한다. 그와 동시에, 체화된 인지(EC)의 최근 연구는 복잡한 인지 과정, 언어, 비언어적 의사소통, 학습과 사회 행동 등 많은 것을 내포하고 있다.

본 논문은 인간과 상호 작용하는 자율적 로봇을 위한 최근 EC 방식 채택을 제안한다. 특히, 우리는 로봇에 적용 할 수 EC의 세 가지 핵심 원칙을 제시 : (a)modal perceptual representation, (b) action ⁄ perception and action ⁄ cognition integration, (c) top-down perceptual biasing의 시뮬레이션 기반의 모델. 우리는 이러한 원칙에 기반을 둔 computational 프레임워크와 두 개의 물리적 로봇에 적용을 설명한다. 이것은 최근의 심리적, 신경 학적 결과에 따라 구현 된 체화된 인간 로봇 상호 작용을 위한 새로운 패러다임을 제공 할 수 있다.

 

1. Introduction

컴퓨터 과학의 여러 응용 사이에서, 로봇은 tautologically동의어로서 embodied이다.

그러나 범위를 확장시키기 위한 지능형 로봇 플랫폼의 기초가 되는 계산 모델의 대부분은 그 사실을 인식하지 못하는 것 같다. 체화라는 것이 로봇연구에 등장했을 때, 낮은 수준의 역학과 네비게이션과 같은 문제를 다루는 단순한 시스템에 보통 적용되었다. 대조적으로, 높은 수준의 지능형, 자율적, 대화(상호작용)형 로봇을 다루는 연구의 대부분은 아직 구상중이다: 추상적 상징 과정 시스템은 최적의 수치 조작에 대한, 그리고 최악의 잡음으로부터 회피하는 프록시와 같은 센서와 작동기로서 로봇의 “몸통‘을 중시했다.

동시에, 심리학 및 신경 과학 연구의 성장 주체는 지능의 체화된 측면이 강조되고 있는 대신에 인지의 추상적 기호 모델에서 멀어지고 있다(Wilson, 2002). 이 견해에 따르면, 인간의 지각과 행동은 추상적 기호 프로세서 또는 규칙 생성 엔진과 같은 단순한 입력과 출력 채널이 아니다. ​​대신 의사 결정, 기억, 지각, 언어는 우리의 육체적인 존재에 얽혀 있고 기반(ground)이 된다(Barsalou, 1999; Pecher & Zwaan, 2005; Wilson, 2001). 중요한 것은, 체화된 인지가 근본적으로 지각적, 물리적, 기억 과제에 제한된 것이 아니라, 사회적 인지, 의사소통 및 공동 활동의 조정과 같은 점점 더 복잡하고 높은 수준의 인지 과정에 적용되고 있다(Barsalou, 2008; Barsalou, Niedenthal, Barbey, & Rupert, 2003; Sebanz & Bekkering, 2006).

본 연구에서, 우리는 최근의 체화된 인지 연구에서 중심이 되는 원칙이 더 광범위한 로봇 시스템으로 전환될 수 있고 그렇게 되어야 하는 것을 제시한다. 특히, 체화된 로봇 인지 연구는 단순한 로봇 시스템, 네비게이션 및 역학을 초월 해서 인간과 함께 공동 활동으로 엮여서 행동하는 자율적 상호작용 로봇에 적용할 수 있다.

자율적 로봇의 비양태적 그리고 모듈적인 관점은 좋은 오래된 유형의 AI(GOFAI)와 cybernetics라 불리는 근간에 의해 설명되어져 왔다. GOFAI는 독점적 추상 기호 처리와 관련되어 논리, 수학, 게임, 데이터 마이닝, 그리고 분류에 있어서 가장 주목할 만한 성공을 했다(Pfeifer and Bongard [2007]). AI가 로보틱스를 다루기 시작했을 때, cybernetics에서 아이디어를 결합한 이런 기호적 전통에 사실상 머물렀다. 그것은 입력(센서), 의사결정(처리과정과 제어), 그리고 결과(운동과 다른 액츄에이터)들 사이에 명확한 분리를 이루었다.

그 결과로, 많은 로봇의 지난 50 년의 역사는 감각 입력을 분석하고 외부 세계 상태를 나타내는 추상 비양태 기호로 분류하고 분석하는 모듈적인 관점을 채택했다. 제어, 학습, 또는 의사결정 과정은 추가적인 하나 이상의 작업을 선택하기 위한 추가적 상징 지식과 함께 이러한 상태를 사용한다. 새로운 감각 지각이 야기하는 결과, 동작은 외부세계를 대체하는 액츄에이터에 의해서 집행되어진다. 따라서 정보는 센서, 의사결정을 위한 세계에서 동작을 통해 세상으로 돌아가기 위한 단일 방향으로 흐른다. 처리의 각 단계는 명확하게 분리되고, 종종 AI와 로봇의 하위영역 전체에 대해 제공하는 별개의 문제로 접근된다.

 

1.1. An embodied alternative

이런 관점의 급진적 변화에서, Brooks(1991)는 “표상 없는 지능”으로 대체할 것을 제안했다. 그것은 독립적인 하위수준의 행동(장애물 회피, 보행동역학walking dynamics 등)이 외부 세계의 기호 표상이 아닌 총체적 지능 창조물을 만든다고 했다. 그는 곤충과 단순한 생명체가 점차적으로 복잡한 시스템의 새로운 속성으로써 지능이 “성장”한다는 관점을 제시했다.

Brooks에 따르면, 로봇공학에서 많은 체화가 깃든(embodiment-inspired) 하위영역들이 드러났다. 로봇공학의 한 부분은 모든 기능이 뇌로 통합되는 인간 지능을 모델링 하는 대신 특히 곤충(e.g., Miki & Shimoyama, 1999; Silva, Teneiro Machado, & Jesus, 2008), 뱀(e.g., Hirose & Mori, 2004) 생체모방 기술(biomimetics)에 초점을 맞추고 있다. 이와 함께, 보행동역학(e.g., Collins, Ruina, Tedrake, & Wisse, 2005; for a review, see Chiel, Ting, Ekeberg, & Hartmann, 2009)-그리고 더 최근에는- 잡기 메커니즘(e.g., Edsinger & Kemp, 2006)이 로보틱스의 비상징적 하위영역인 체화된 것으로 연구되고 있다.

AI의 하위영역“인공 생명Artificial Life”는 또한 로봇 지능에서 다른 종류의 비표상적 접근이 깃든, 간단한 규칙에서 새롭게 생겨나는 복잡한 행동의 다양성을 실험했다. 한 예로 “swarm robotics(기능이 단순한 복수의 로봇을 이용하여 로봇 간 상호작용과 협업으로 복잡한 작업이 가능하도록 하는 복수로봇 시스템)” 독립적인 많은 수의 독립적 로봇행동이 간단하게 로컬 상호 작용을 통해 집단적으로 행동한다는 것이다. 다른 하나는 '로봇의 전반적인 동작을 물리적 하위 파트의 각각에서 독립적으로 제어하는 “모듈 로봇”이다.

연구의 이런 선상은 로봇공학에서 AI 상징 처리의 독점적 상태에서 물러났다. 하지만 이러한 체화된 해석은 대부분 매우 간단한 시스템이거나 특별한 기술적 그리고 감각 동역학 문제의 해결을 처리하는 시연을 하였다.

한편, 개인 로봇공학과 사교적 로봇 분야는 인간과 같은 그리고 인간대화형 시스템에 포커스를 돌리기 시작했다. 일부 연구자들은 인공 사회적 행동과 대인관계 의사소통을 위한 새로운 모델을 시작하는 인간-로봇 팀에서 동료로서의 로봇을 구상하였다. 그러나 많은 이러한 대화형 로보틱스를 향한 노력은 그들이 인간과 로봇이 상호작용하는 모델을 '담론 이론‘의 논리 기반과 언어적 기반에서 비중 있게 다루었던 부분 때문에 지능의 더 전통적인“고전적 방식의good old-fashioned” 관점으로 돌아갔다.

그러나 신경과학과 심리학에서 반대의 경향이 개발: EC는 보다 정교한 인지 과제의 증가에 적용된다는 것을 발견했다. 체화된 메커니즘은 추상적인 생각, 언어, 수학적 추론과 학습을 모델링할 뿐 아니라, 사회적, 도덕적 의사 결정을 할 수 있는 것을 보여준다. 그리고 체화된 표현은 사회적 상호작용, 의사소통 및 조정의 양상을 설명 할 수 있습니다.

 

1.2. Embodied cognition for autonomous interactive robots

이러한 연구 결과는 EC의 측면에서 높은 수준의 인공적 인지와 자율적 대화형 로봇의 재평가를 제안한다. 현재 자율적 대화형 로봇에서 작업의 대부분은 이러한 불연속성과 같은 추상적인 기호체계, 강건한 구조 및 속도 저하의 단점으로 고생하고 있다. 동시에, EC는 사회적 상호 작용에 새로운 모델과 이론적용을 제안한다. 따라서 우리는 특히 로봇의 주변 환경과 인간의 다른 한 쪽(counterparts)을 가진 유기적 활동이 요구되는, 인간의 상호 작용을 목적으로 한 자율적 로봇의 맥락에서 EC의 새로운 관점을 제안한다.

특히, 우리는 양태적 지각 표상, 행동의 통합, 지각과 인지의 아이디어와, 그리고 자극기반의 하향식 지각 편향의 개념이 그런 로봇의 설계에 정보를 줄 수 있다고 믿는다. 그 효과에서, 우리는 두 개의 physical 로봇 시스템에서 사용 된 새로운 컴퓨팅 프레임 워크에서 이 세 가지 아이디어의 구현을 제시한다. 본 논문은 EC의 아이디어를 대화형 로봇에 적용 할 수 있는 추가적 방법 제안이 결론이다.

 

2. Three embodiment principles for autonomous interactive robots

이 섹션에서, 우리는 자율적인 대화형 로봇에 적용 할 수 있는 세 가지 EC 원칙을 제안한다.

 

2.1. Modal perceptual representation

기존의 로봇 연구는 정보가 정보 검색, 의사 결정과 나중에 동작 발생에 사용된,

지각 자극에서 비지각적 기호로 처리된다고 주장하는 지식의 비양태 이론을 사용한다. EC의 최근 연구 결과는 지각과정 동안 사용된 몇몇 같은 메커니즘을 사용하는 양태적 표상에 기반을 두는 개념인 인지의 지각적 모델을 제시하는 이 관점에 도전한다. 증거의 범위를 지지하는 이것의 예를 들면, 대상자가 비지각적 방법의 개념을 사용할 때 지각적 신경 활성이다; 문장을 읽을 때 나타나는 시각 프라이밍은 시각적 지남력이 적용되었다; 음성 장애와 일치하는 기억회상 장애; 그리고 시각적으로 뚜렷한 변화와 대조적으로 개념에서 시각적으로 유사한 변화를 비교하는 속도가 증가했다.

지각표상의 개념은 수많은 방법적인 면에서 인지의 계산적(computing) 모델로 변환될 수 있다. Gray, Breazeal과 동료들은 신념(belief), 의도 그리고 인간 동료(peer)의 목적을 추론하는 로봇 시스템을 위한 자극-이론 모델simulation-theoretic model을 제시하였다. 로봇은 조망수용(perceptual perspective), 동작의도, 그리고 인간 동료로써 또는 상대로써의 과제 목표를 시뮬레이션 하기위한 동작발생에 사용하는 그런 동종의 지각시스템을 제 사용한다. 시스템 사용의 인간 대상 연구는 같은 상황에서 인간에게 유사한 행동을 나타내는 로봇을 보여줍니다.

본 연구에서는, 우리는 수렴지대의 정신에서 양태적 지각표상을 사용하는 개념, 기억, 그리고 의사결정의 또 다른 계산적 모델을 제안한다. 섹션 3에서 설명했던 틀에서, 의사 결정은 동작의 방아쇠(trigger)가 되는 지각의 경로biasing과 감각 처리과정의 단계layer에 의해서 지각을 처리하는 동일한 양태 시스템에서 일어난다. 학습 역시 속성 및 양태 지각 처리 시스템의 연결을 변경하여 모델링되지만 비양태 상징적 규칙과 관계의 생산에 의해서는 그렇지 않다. 지각 시뮬레이션의 과정을 통해 artificial agent's world의 모델은 실재 세계와 시뮬레이션 된 지각의 혼합으로 나타내어진다. 이것은 인간의 프라이밍과 실제에 가까운 메커니즘을 허락하고, 학습 및 조건화의 기초를 제공한다.

 

2.2. Action ⁄ perception and action ⁄ cognition integration

인지의 지각기반 이론 뿐 만 아니라, 인지 과정이 운동 활동과 유사하게 엮여 있다는 것을 이해하고 있다. 인간 발달 심리학에서의 증거는 운동과 인지발달이 이질적이지 않고 높은 상호 의존적이라는 것을 보여준다. 서로 다른 하지만 매우 상호 의존적 아니라는 것을 보여줍니다. 예를 들면, 3 개월 된 유아의 잡기 능력을 인위적으로 강화시킨 것은 이미 잡기를 하는 유아의 나이 수준에서 일부 인지 능력과 동일하다는 것을 보여줍니다(Sommerville, Woodward, & Needham, 2005). 성인의 행동은 유사한 상호 의존성을 표현한다 : 수신호는 언어 생성동안 어휘를 찾는 도구로 보인다. ​​그리고 action⁄cognition 관계는 speech생성 동안 머리의 움직임과 얼굴 표정에 중복 설계된 연구 결과가 지지한다(Chovil, 1992; McClave, 2000). 윌슨( 2001)은 둘 사이의 상호적이고 종종 불수의적인 영향으로 이끄는 인식과 동작 사이의 동형 표상을 시사한다.

반면에, 로보틱스에서 action과 motor 실행의 역할은 전통적으로 중앙 의사 결정의 수동적 ‘client’로 그리고 로봇 시스템에 있는 데이터와 제어 흐름의 받는 쪽(receiving end)으로 비쳐져 왔었다. 심지어 소위 말하는 Active Perception frameworks(Aloimonos, 1993)에서, 지각에서 동작의 영향은 세상에서 그 주변 환경이나 perspective의 변화하는 에이전트를 통해 중재된다. 그리고 내부 처리 경로에 의해서는 그렇지 않다.

대신, 우리는 동작이 대칭적 동작-지각 활성과 네트워크의 형태로 대화형 로봇의 인식과 지각에 영향을 줄 수 있다는 것을 제시한다. 이러한 네트워크에서 지각은 잠재적인 동작 선택에 이르는 높은 수준의 연합에 영향을 미치지만, 능동적 motor 활성을 통해서 반대로 편향(bias)된다. 우리가 제 3장에서 주장하는 motor의 활성과 지각 처리과정 사이의 긴밀한 통합은 로봇과 인간 협력자collaborator 사이에 더 고차원적인 체로 걸러낸(meshed) 활성을 이끌 수 있다.

 

2.3. Simulation-based top-down perceptual biasing

위에서 설명한 두 가지 원칙뿐만 아니라, 관련 실험 데이터의 큰 부분body은 다음과 통찰력에 상승을 제공 한다 : 지각 과정은 로봇공학과 AI 시스템에서 종종 모델링 되었던 원자료로raw 사용 가능한 데이터의 엄격한 bottom-up분석을 하지 않는다. 대신, 지각 과정의 시뮬레이션은 새로운 지각 데이터 수집에 영향을 미치고, 운동 지식(motor knowledge) 감각 처리에 사용된다. 그리고 의도, 목표, 그리고 기대는 모든 의미 있는 객체로 세상을 분석하는 능력에 모든 역할을 한다. 다른 말로, 감각-지각 시스템은 인지와 동작 처리과정에 의해 높게 간파할 수 있다.

많은 실험 데이터는 지각이 종종 예측 활동이라고 할 뿐 아니라 하향식 (top-down) 시뮬레이션이 예측 행동에 대한 실용적 모델이라고 제시하는 이 가설을 지지한다. 몇 가지 예를 제공하면 : 시각적 지각에서, 정보는 하위 수준의 메커니즘인 top-down( Kosslyn , 1995) biasing에 방아쇠를 당기는 어떤 대상에 대한 프라이밍을 야기 시키는 upstream 과 downstream 경로를 알게 되었다. 마찬가지로 , 시각적 독화술은 음성 신호가 알 수 없는 원자료를 처리하는 과정이 아니라고 지시하는 청각적 음절의 지각에 영향을 미친다. 높은 수준의 처리과정은 대상자가 완전치 않은sparse 시각적 정보에서 “복잡한 동작, 사회적 위치, 성별, 그리고 수화”를 식별할 수 있는 point light display로부터 사람의 형상을 지각하는 것을 포함하는 것으로 보인다(Thornton, Pinto, & Shiffrar, 1998). 결과와 관련된 면밀한 검토는 Wilson and Knoblich (2005) and Barsalou (1999)를 보라.

top-down영향의 개념이 컴퓨터 시스템에서 몇몇 시각적 과제를 위한 실험을 해오는 동안, 인간과 물리적인 상호작용을 하는 autonomous robots의 context에서 top-down 처리방식의 사용을 위한 동작, 개념, 예측이 하위 수준의 지각과 감각 모듈에 영향을 줄 수 있는 추가적인 가능성이 있다. 우리는 더욱이 사회적인 구조에서 상호작용을 하는 면에서 함께 일하는 인간과 로봇사이에 더 능숙한 협동작용에 구체적인 열쇠가 될 수 있을 것이다.

 

3. Implementation

우리는 두 가지 다른 autonomous interactive robots자율적 대화형 로봇에 구현된 computational framework계산적 틀에서 위에 배치했던 원칙들을 예로 들었다. 인간 ‘프라이밍’과 유사한 핵심적 메커니즘은 인간 파트너의 활동과 그에 따르는 지각적 경로의 편향biasing 의 모델링을 기반으로 한다. 이것은 두 과정에 의존한다.; 1) 반복적인 과거 이벤트에 기반을 둔 인간 동작의 예측, 2) 지각 과정의 top-down bias가 야기하는 양태적 지각 자극으로써 예측되는 기대를 모델링하는 것.

이것을 허락하기 위해서, 개념이 양태적 활성과 감각 데이터를 처리하는 지각 stream에 있는 특별한 패턴으로 모델링된다. 동작은 지각 자극에서 발생하는 그들의 활동을 통해 bottom-up이 방아쇠가 당겨진다. 그리고 반대로 지각 경로 bias에서 예상된 개념은 그 개념의 특성과 속성을 검출할 것이다. 이것은 joint actions에서 더 높은 능숙도와 효율성의 결과를 낳는 확증적 감각사건에 대한 반응 시간을 줄이게 된다.

 

3.1. Modality streams and process nodes

우리는 처리과정 node간에 연결로 이루어진 modality streams의 형태를 우리의 시스템으로 구성했다. 이들 node는 raw sensory입력(영상 프레임과 같은)에, 특징(주조색 또는 측정점data point의 방향과 같은), 속성(물체의 속도와 같은), 또는 특징과 속성의 통계적 일치성을 설명하는 고위 수준 개념에 일치할 수 있다. 이것은 modal concept representation양태 개념 표상의 원칙에 일치한다(Section 2.1).

Modality streams은 action nodes로 구성된 action network와 연결되어있다. 이것은 지각 처리 node와 같은 방식으로 활성화 된다. 결국, action node는 motor action의 수행을 이끈다. 중요한 것은, 활성화는 양 방향, 구심성- 감각시스템에서 개념과 동작으로- 그리고 반대로, 원심성방향으로 흐른다(Section 2.2).

각 node (Fig. 2)는 바깥 세계로부터 들어오는 처리과정을 나타내는 activation value활성 값, 를 포함한다. 독립적 시뮬레이션 된 활성 값 는 node의 activation behavior와 처리과정을 또한 참작한다. 그리고 이것은 top-down 처리과정에서 생긴다(as proposed in Section 2.3). 활성과 시뮬레이션의 조합은 또한 운동 활성의 trigger를 일으킨다.

 

 

3.2. Priming

인간에서, ‘프라이밍’은 감각 또는 기억 사건으로의 bias(종종 반응시간이 감소하는 것으로 측정한다)이다. 그런 프라이밍은 cross-modal양태간 활성을 통해서, 이전의 활성을 통해서, 또는 기억의 회상으로부터 발생할 수 있다.

Fig. 3에 예시된 인공적 에이전트에서 사용되는 modal priming의 예를 보면; 청각적 지각(“Elmo”의 소리)은 Elmo 그림의 시각적 기억을 활성화시킨다. 이것은- 시각적 지각에서 사용하는 같은 경로를 사용해서- 이미지의 주조색으로 분석한다(왼쪽 두 번째 프레임). 그런 다음 이 색은 하위 시각적 버퍼에 영향을 주는 bias로 사용된다. 유사한 색의 영역의 검출하기위해 이동, 결국 시각적 영역에서 더 순조롭게 Elmo puppet을 검출하기위한 시스템에 권한이 부여된다.

이런 architecture에서 인공적 프라이밍 메커니즘은 다음과 같은 작업을 한다; 어떤 높은 수준의 node n은 프라이밍을 통해 활성화 된다면, 낮은 수준 node인 feed n는 원심성 경로의 시뮬레이션 값 를 통해 부분적으로 활성화 된다. 가 낮은 수준 node에서 감각 기반 활성화 가 추가됨에 따라, 동작에 방아쇠를 당기는 실세계 감각기반 활성 역치를 감소하는 이 시뮬레이션 된 top-down penetration은 본질적으로 그 하위 노드의 활성화에 필요한 지각 활성화를 낮춘다. 결과적으로 감각사건에 기대되는 반응시간을 줄이면 자동적 motor behavior이 증가한다.

 

 

3.3. Sources of priming

지각 시뮬레이션의 소스는 무엇입니까? 우리는 제안된 지각 노드 아키텍처에서 프라이밍을 지원하는 두 개의 top-down 하위시스템을 구현했다.

 

3.3.1. Markov-chain Bayesian anticipatory simulation

그 첫 번째는 Markov-chain Bayesian predictor(미래를 결정하는 물리적인 절차에 있어 과거의 경력은 현재의 상태에 대한 지식과 같은 양의 정보를 갖고 있다는 -미래의 상태를 결정하는데 있어 현재의 상태가 주어질 때 과거의 상태에는 영향을 받지 않는다.)이다. 그것은 실행하는 동안 순환활성단계에 기반을 둔 노드 활성의 probabilistic map확률적 지도를 만든다. 이 시스템은 Hoffman and Breazeal (2007)이 설명한 예측적 시스템의 정신이다. 그것은 -원심성 경로를 통해- 하위 수준 지각 노드의 활성을 편향하는 고위 수준 시뮬레이션을 trigger한다. 예를 들어 빨간색 정지등이 신호등에서 일반적으로 노란색 등 다음에 켜진다면, 노란색 신호등 개념의 활성은 빨간색 등 개념을 활성화 시킬 것이다. 그것은 결국 빨간 물체에 더 반응성 로봇을 만드는 지각 시스템에서 빨간색 특징 검출기의 활성을 bias편향한다.

실제 세계 감각 정보 다음에 이런 지각적 기대가 생긴다면(신호등이 실제로 빨간불로 바뀐다), 로봇의 반응시간은 위에서 설명한 것처럼 짧아질 것이다. 감각정보가 시뮬레이션 된 지각을 지지하지 못하는 경우, 반응시간을 길어지고 temporary erroneous action(일시적으로 잘못된 동작)을 일으킬 수 있다. 이것은 그런 다음 현실 세계 감각정보에 의해 수정될 것이다.

※ Markov-chain : 시간에 대한 이산적 연속체의 형식을 갖는 마르코프 사슬은 미래의 값(상태)을 결정하는데 있어 현재의 상태가 주어질 때, 과거의 경력은 영향을 미치지 않고 현재의 상태에서만 결정된다. e.g. 운이운을 부른다. 확률 1억 3421만 7728분의 1이라는 퍼펙트게임- 실제로는 2,3만 경기당 1번꼴로 일어나는 이유.

 

3.3.2. Intermodal Hebbian reinforcing

priming의 두 번째 메커니즘은 활성된 연결에서 보이는 Hebbian 강화이다. Node 연결은 노드사이에서 가중치가 역동적으로 변화하는 연결 강화 시스템으로 배치할 수 있다. 이 시스템은 헵(1949)이 소개한 우연성의 원리에 따라 발생한다. 그것은 주기적 그리고 지속적 공동-발생하는 강화연결이고, 드물거나 지속적이지 않은 연결의 가중치가 감소하는 것이다(‘함께 발화하면, 함께 배선된다’는 원리). 지속적 우연한 활성의 강화는 양태들 간의 지각 노드에서 예상된 시뮬레이션 지각을 이끈다. 예를 들면, 실생활에서 ‘토마토’라는 단어의 소리는 ‘빨강’이라는 시각적 개념을 강화할 수 있다. 다시 말해 이것은 위에서 설명한 반응시간을 줄여주는 하위 지각 노드에서 triggers top-down biasing이다.

 

3.4. Application and evaluation

우리는 인간의 파트너로써 공동 작업을 수행하기 위해 설계된 두 개의 물리적인 로봇 플랫폼(Fig. 4)의 틀을 적용했다. 두 개의 로봇은 반복적 연습을 통해 동작 능숙도와 인간행동에 관한 반응시간의 관점에서 평가되었다. 첫 번째 로봇, Leonardo는 복잡한 표정을 짓는 humanoid이다. 우리는 반복을 통해서 아이들의 게임 ‘Patty Cake’과 유사한 상호작용을 하는 것에서 로봇의 반응시간을 감소시킬 수 있다. 그 로봇의 과제는 사람이 손 제스쳐를 여러 번 arbitrary sequence(임의순서; 명령마다 그 다음에 실행 할 명령의 주소를 지정하여 컴퓨터 실행 순서를 임의로 결정하는 것)로 반복함으로써 인간 플레이어가 직면하는 손동작 패턴을 반영하였다.

두 번째는 nonhumanoid robot인 AUR 책상램프형 로봇에 적용되었다. 이 연구에서, 인간과 로봇은 같은 장소의 각 위치에 대하여 공간에서 함께 움직이고 각 상황에 맞는 특이한 light colors를 선택하는 협동과제를 해결해야했다. 다시말해서 인간은 상호작용과 여러 번 반복된 같은 패턴을 이끌었다. 이 셋업을 위해서, 우리는 Markov-chain Bayesian and Hebbian reinforcement simulation을 사용했다.

훈련을 받지 않은 대상과 비교해서, 우리는 우리의 프레임워크가 예측적 지각시뮬레이션을 사용하지 않는 시스템과 비교해서 더욱 유의한 효율성과 능숙도를 보였다. 우리는 또한 팀 능숙도, 시간에 따른 팀의 향상도, 로봇의 효율성과 능숙도의 기여도, 로봇의 지능, 그리고 로봇의 과제 적응력의 인간 대상자의 분별력(감)에서 두 가지 조건사이에 유의한 차이가 있다는 것을 알게 되었다. 이 연구의 결과는 Hoffman and Breazeal (2010)가 보고하였다.

 

 

4. Discussion

우리는 지능이 지각, 인지, 그리고 동작이 다방면적 및 동시적인 방식으로 엉켜있고 구동하지 않는다는 것 대신 지각 처리 모듈에서 독립적 운동 장치로서 추상적 기호 처리된 일방향성으로 만들어진 것이 아니라는 관점으로 EC를 이해한다. 최근에 EC연구는 복합적인 지각, 의사소통적, 그리고 사회적 메커니즘을 포함하는 많은 인지적 능력을 증가시키는 모델과 해석을 확장시켜왔다. 동시에 가장 높은 수준의 인지 기능은 지각과 동작이 비양태 결정 시스템을 위한 말초적 채널이라는 전통적 기호-처리 관점으로 되돌아가는 로보틱스에서 모델링되었다. 이것은 인간 파트너와 함께 언어적 그리고 비언어적으로 갖는 개인 및 사교적인sociable 분야의 연구에서 특히 사실이다.

본 논문에서 우리는 autonomous interactive robotics를 위한 새로운 패러다임을 고무시킬 수 있는 EC의 세가지 방법을 제시했다. 특히 우리는 EC기반 인지 로봇 아키텍쳐를 위한 1)modal perceptual repre-sentation, (b) action ⁄ perception and action ⁄ cognition integration, and (c) a simulation-based model of top-down perceptual biasing을 제시했다. 우리는 또한 이들 원칙에 전형적인 예가되는 예측 가능한 지각 시뮬레이션 프레임워크와 훈련받지 않은 사람을 대상으로 상호작용을 사용한 두 가지 로봇 플랫폼에 적용을 제시했다.

어떤 computational system에서 체화된 인지 원직을 적용하는 것은 모든 computation이 가장 하위수준에 있고, 기호, 추상, 그리고 모듈적이기 때문에 본질적인 도전이다. 그 말은, 한 가지는 로보틱 시스템에서 EC의 핵심적인 심리학적 그리고 신경과학적인 결과를 구현하는 충분한 기회를 만드는 광범위한 관점에서 인공지능과 대화형 로보틱스를 볼 수 있다. 그리고, 로봇이 항상 물리적인 환경에서 움직이기 때문에, 그것은 pseudoperfect 정보에 걸친 noisy filter로써 그들의 물리적인 존재로 보는 것을 중단하게 피팅하는 것이다. 대신에, 특히 인간과 상호작용을 할 때, 로봇은 인간의 뇌가 그 자신의 물리적 상황과 마찬가지로, 로봇은 체화를 사용해야한다.

체화는 단순한 자율적 시스템으로 모델링하는 그리고 특정 메카닉과 감각 동역학 문제의 해결하는 로보틱스에서 첫 번째 장소를 발견했다. 이것은 AI의 전통적인 관심사를 버린다는 것을 시사한다; 언어, 의사결정, 계획, 규칙학습. 그러나 EC연구가 높은 수준 인지의 요소를 설명하기 시작하고 성숙했기 때문에, 자율적 로보틱스는 이런 상황에서 체화의 재평가로부터 이익을 얻을 수 있다.

몇몇 로보틱스 연구자들은 그들이 하는 일에서 체화 원칙을 통합하기 시작해왔다.

Gray and Breazeal의 시뮬레이션 연구는 위에서 언급했다. Gorniak and Roy (2007)는 로봇의 물리적 환경에 있는 언어 이해의 computational 이론을 제시했다.

다른 로보틱스 연구는 내적 상태(Breazeal, 2002)를 표현하는 물리적 행동으로써 사회적-체화된 아이디어 그리고 물리적 모방(Riek, Paul, & Robinson, 2009)의 사회적인 효과와 관련되어왔다. 이 논문에서, 우리는 자율적 대화형 로봇을 적용하는 EC의 지각-시뮬레이션 설명을 제시했다.

그러나, 여전히 많은 최근의 인지와 신경심리학적 결과 및 모델은 특히 훈련받지 않은 인간과 물리적인 상호작용하는 로보틱스에 적용되었다. 예를 들면, commonsense reasoning(상식적 추론; 이미 알고 있는 상식적인 여러 지식 및 규칙을 이용하여 어떤 사실 또는 미지의 표현을 유도해 내는 일)- AI의 중요한 분야는 여전히 amodal symbolic models비양태 기호 모델의 광범위한 사용이다(e.g., Havasi, Speer, Pustejovsky, & Lieberman, 2009; Liu & Singh, 2004).- 그들의 체화된 경험을 사용하는 세상에 대하여 추론 할 때 인간과 같은 메커니즘을 사용할 수 있다. 또한, 컴퓨터 게임과 디지털 유흥이 더 물리적인 현실에 기반이 됨에 따라, 스포츠와 행위예술에서 체화된 훈련에서 학습은 더 많은 반응을 만들고 그런 데로 괜찮은 자율적 게임 에이전트와 인터페이스를 사용될 수 있다; 사람들은 심지어 행위예술가과 운동선수의 체화된 기술을 사용하는 ‘‘artificial practice’’의 전혀 새로운 분야를 상상할 수도 있다. 마찬가지로, 한 분야의 대가master craftsmen로부터 EC의 이해는 물리적 과제를 해결하는 산업적 로보틱스에 새로운 빛을 발산할지도 모른다; 체화된 인간-로봇 견습공(미숙한 상태)의 새로운 형태가 드러날지도 모른다. 발전된 EC는 보육을 목적으로하는 로보틱스에서 새로운 패러다임을 제공할 수 있다. 그리고 마찬가지로, 지각-동작 통합은 간호로봇, 그리고 그들의 집에서 노인을 수발하도록 설계된 시스템을 위한 더 실질적인 비언어 인터페이스를 이끌 수 있다.

EC에서 많은 결과들, 그리고 증가하는 연구는 인공지능의 체화가 성장하는 것과 인간-대화형 로보틱스의 더 정교하고 새련됨과 병행하여 이루어진다. 그것은 일반적, 그리고 특히, 자율적 대화형 로봇에서 EC모델을 채택하기위한 근본적인 기회를 제공한다.

 

반응형

댓글