[로봇 매니퓰레이션 혁명-①] 매니퓰레이션 힘 제어 연구 동향

게재월 | 2018 - 03 조회21891 추천0

목록으로 글자확대하기 글자축소하기

사물을 조작하거나 주위환경을 변화시킬 때 사람은 시각 정보 이외에 역각 정보를 잘 이용하여 작업한다. 힘 제어는 사람과 같은 재주를 가진 매니퓰레이션을 위해서는 필수적이어서 힘 제어 연구는 로봇 연구 여명기 때부터 진행됐다. 최근 로봇이나 센서 등의 하드웨어 발전을 배경으로 힘 제어의 실용화가 가속되기 시작했다.


본 연구에서는 이러한 상황에 비추어 매니퓰레이션 분야에서의 힘 제어 연구 동향에 대하여 개략적으로 설명한다. 우선 기초적인 힘 제어 방식에 대해서 분류하고, 실용화 상황과 실제로 힘 제어를 이용하여 작업하는 데 필요한 제어 전략 구축에 대해서 연구 동향을 설명한다.


힘 제어의 분류


환경과의 상호작용을 고려해 로봇에 유연함(넓은 의미의 컴플라이언스)을 실현하는 제어 방법은 Compliant Mo-tion Control이나 넓은 의미의 힘 제어라고 불리며, 빠르게 연구가 진행됐다.


1950∼1960년대에는 힘 피드백을 갖춘 원격 조작 로봇과 의수가 개발되기 시작했다. 1970∼1980년대에는 하이브리드 제어 및 임피던스 제어 등의 중요한 제어 방식이 제안되어 기초적인 방법론이 거의 확립됐다고 할 수 있다. 그 후로도 안정성 등의 제어 방법의 성능이 향상되고, 다양한 응용 분야에 적용되는 연구가 발전하고 있다. 


힘 제어 방식은 그림 1과 같이 분류할 수 있다. 수동적 컴플라이언스는 위치 제어된 암의 손 끝에 스프링과 댐퍼 등의 유연한 기계요소를 환경과의 인터페이스로써 설치하는 방법으로, Peg-in-Hole용 RCC(Remote Center Compliance)가 널리 알려져 있다. 기계요소에 의해 실현되기 때문에 힘에 대해서 높은 응답성을 가지지만, 작업 내용에 따라서 설계되는 고정적인 컴플라이언스가 된다.


▲ 그림 1 힘 제어 방법의 분류


능동적 컴플라이언스는 로봇의 서보계에 의해 부드러운 동작을 실현하는 방식으로, 일반적으로 힘 제어로 불리는 것이다. 로봇과 환경과의 사이에 생기는 힘을 목표치에 따라 제어하는 직접적 힘 제어와, 로봇에 가해지는 힘과 로봇 거동의 관계를 제어함으로써 가상적으로 컴플라이언스를 실현하는 간접적 힘 제어로 나뉜다.


전자는 힘을 제어하는 자유도와 위치를 제어하는 자유도를 나누어 각각에 힘, 위치 제어하는 하이브리드 제어가 일반적이다. 후자는 서보계가 위치 제어 기반 방법과 토크 제어 기반 방법으로 분류할 수 있다. 하이브리드 제어는 힘을 직접적으로 제어하기 때문에 정확하게 제어할 수 있지만, 작업을 적절하게 위치 제어 방향과 힘 제어 방향으로 나눌 필요가 있으며, 작업 중에 위치 제어와 힘 제어 방향을 바꾸는 경우에 제어가 불안정해진다는 문제점이 있다.


간접적 힘 제어에서는 로봇이 아래 식에서 나타내는 바람직한 컴플라이언스를 실현할 수 있도록 외력에 따라 로봇 조작량을 제어한다. 시스템 전체의 컴플라이언스를 지정하기 때문에 여러 작업에 적용하기 쉽다.



여기서 Md, Dd, Kd는 실현하고자 하는 관성, 점성, 강성 행렬이며, Fext는 외력, e=(x-xref), x와 xref는 각각 손 끝 위치와 목표 손 끝 위치이다.


그림 2는 각 제어의 기본적인 구조이다. 위치 제어 기반에서는 조작량 자동 제어를 위치로 입력하고, 토크 제어 기반에서는 직접 관절 토크를 입력한다. 위치 제어 기반에서는 내부에 통상적인 위치 제어 루프가 존재하며, 그 밖에 힘 제어 그룹이 추가됨으로써 힘 제어가 실현된다(이때 힘 제어 보상기는 어드미턴스로 작용한다). 외력에 비례하여 위치 목표를 보정하는 강성 제어, 위치 목표를 외력의 적분에 따라 수정하는 덤핑 제어, 그것들을 일반화하여 손끝의 매스, 댐퍼, 스프링 효과를 실현하는 임피던스 제어가 대표적인 것이다.


▲ 그림 2 제어계의 기본 구조


토크 제어 기반에서 힘 제어 보상기는 임피던스로서 작용하고, Active Stiffness Control과 Hogan의 임피던스 제어가 널리 알려져 있다. 위치 제어 기반과 토크 제어 기반은 다음과 같은 상반된 경향을 가지며, 각각의 이점을 활용하기 위해 위치 제어 기반과 토크 제어 기반을 전환하는 방안도 제안되고 있다.


[위치 제어 기반]

•‌ low impedance(부드럽게 제어)에서는 제어계의 피드백 게인이 커져 불안정해지기 쉽다

• 로봇의 모델화 오차에 대해서 로부스트

• 동역학 보상이 필요 없고 제어 계통이 단순해진다

• 힘 제어 성능은 내부의 위치 제어 루프의 성능에 의존


[토크 제어 기준]

•‌ high impedance(견고하게 제어)에서는 제어계의 피드백 게인이 커져 불안정해지기 쉽다

• 임피던스 특성의 실현성이 높다

•‌ 위치 제어의 정확성은 로봇의 모델화와 힘 제어 보상기의 성능에 의존


이렇게 방법별로 다양한 특징이 있기 때문에 사용하는 로봇이나 작업 대상에 따라서 적절하게 선정할 필요가 있다. 위치 제어 기반의 힘 제어는 기존의 고강성 산업용 로봇에 적합하기 때문에 폭넓게 이용되고 있다. 한편에서 토크 제어 기반의 힘 제어에서는 고성능 힘 제어를 실현할 가능성으로 인해 기대가 높다.


힘 제어의 실용화


연마, 디버링, 조립 작업 등 일찍부터 일본에서 힘 제어를 실제 작업에 활발하게 적용됐다. 하지만 pick and place 같은 자유 공간에서의 작업에 비해 현장에서 실용화된 것은 적다. 힘 제어 실용화의 장애물로는 특성을 알 수 없는 많은 환경이나 대상물과의 접촉에 따른 안정성에 대한 불안, 위치 제어 작업에 비해서 역각 센서나 힘 기능이 추가로 필요한 점, 작업 대상이 복잡한 점 때문에 많은 제어 전략을 세우기가 어렵다.


제어 방식의 연구 성과, 센서의 성능 향상과 가격 하락, 인력 부족과 생산 방식의 변화에 따른 자동화 요구 확대 등을 배경으로 최근 힘 제어 기능을 갖춘 산업용 로봇을 각 로봇 제조 업체가 라인업하고 있다.


기본적으로는 손끝에 역각 센서를 갖고, 그 출력에 근거한 위치 제어 기반의 힘 제어가 실현되고 있어 지능화의 한 요소로 부품 삽입이나 조립, 나사 조임, 작업 상태 인식과 오류 검출 등이 실현되었다. 또한, 최근 몇 년은 ISO10218-1,2:2011이 시행됨에 따라 비교적 사람과 협동하는 소형경량 로봇에 대한 연구가 왕성하다. 사람과 동일한 환경에서 일하기 때문에 협동 로봇에게 힘 검출 기능이 필수적이다.


UR 시리즈(Universal Robot)는 전류값을 통해 각 관절에 걸리는 회전력을 추정하여 안전 기능이나 다이렉트 티칭, 힘 제어 기능을 제공한다. Sawyer(Rethink Robotics)는 각 관절에 역각 센서를 가졌으며, Yumi(ABB)는 7자유도의 암에 대해 각 관절의 전류값과 위치, 자세로부터 손 끝에 걸리는 외력을 추정하는 소형 부품의 조립을 실현했다.


토크 제어 기반의 힘 제어 기능을 가진 로봇도 시장에 나오고 있다. 이 방식으로는 고성능 힘 제어를 실현할 것이란 기대가 높다. LBR(KUKA)은 DLR에서 개발된 light-weight robot이 기술 이전된 것으로, 각 관절에 토크 센서를 가져 토크 제어 기반의 임피던스 제어 기능을 제공한다. 또 관절 위치의 피드백 루프를 토크 제어에 추가함으로써 위치 결정 정밀도를 향상시켰다. 매끄러운 다이렉트 티칭과 복잡한 조립 작업이 가능해 제조 현장에서 널리 사용되고 있다.


이외에도 토크 제어 가능한 로봇 팔로서 Torobo Arm(Tokyo Robotics)과 Franka(Franka Emika) 등이 판매되기 시작했다. 이들은 연구용으로 내부 제어 프로그램이 공개되어 있으며, 각자 자유롭게 토크 제어 기반의 힘 제어 방식을 시험할 수 있다. 힘 제어 기능을 가진 로봇이 우리 일상으로 다가오고 있어 힘 제어의 실용화와 연구가 더 발전할 것으로 기대한다.


작업 실현을 위한 제어 전략의 구축


힘 제어가 연구 분야로서는 성숙한 한편, 실제 적용 사례가 적은 큰 원인 중 하나로서, 실현하고자 하는 컴플라이언스 등의 힘 제어 파라미터의 설정을 포함한 제어 전략 구축이 어렵다는 점을 들 수 있다.


힘 제어가 필요한 작업은 대상물의 조작이나 환경과의 접촉을 포함하기 때문에, 비교적 복잡하고 작업 해석이 어려워지기 쉽다. 사람이 쉽게 하는 작업이라도 무의식적으로 하는 작업일수록 어떻게 상태를 인식하고 힘을 조정하는지에 대한 노하우를 작업자 스스로 표현하지 못하는 경우가 많다. 사람의 작업 중 임피던스를 지침으로 이용할 수도 있지만, 사람도 작업 상황에 따라 임피던스를 잘 조정하기 때문에 하나의 측정 결과를 공통된 지침으로 하는 것은 어렵다.


힘 제어가 필요한 작업에 대한 제어 전략의 구축에 대해서는 여러 연구가 이루어지고 있으며, 1) 이론적 설계 방법, 2) 데모에 기반한 방법, 3) 실험적 설계 방법, 크게 3종류로 분류할 수 있다.


1. 이론적 설계 기법

이론적 설계 방법의 경우 작업 달성을 위해 힘 제어 파라미터가 충족해야 할 조건을 작업의 기하학적 역학적 해석을 기초로 도출한다. 환경과 접촉한 작업을 달성하기 위해서는 환경과 기하학적인 구속 요건을 만족하고, 작업 중에 생길 수 있는 위치, 자세 오차를 수정하는 동작이 가능해야 한다. 기본적으로는 작업 중 접촉 상태를 열거하고, 적절한 접촉 상태의 전이를 실현하는 동작을 생성하기 위해 힘 제어 파라미터가 충족해야 할 조건을 도출한다.


예를 들어 덤핑 제어(주1)에서 로봇에 대한 명령 속도나 반력에 대한 속도 수정량을 정하는 파라미터에 대해서 작업 달성을 위한 조건이 정식화되어 조건부 최적화 문제로 풀어냄으로써 최적 파라미터의 설계가 이루어진다. 


이론적 설계 방법에서는 각종 연구가 이루어지고 있는데, 접촉 상태 열거 등의 작업을 분석할 필요가 있으므로 적용 예는 면 맞추기 작업이나 평면 공간에서 이루어지는 삽입 작업 같은 간단한 작업에 한정되어 있다.


2. 데모에 기반한 방법

데모에 기반한 방법의 경우 사람의 데모 작업 데이터로부터 접촉 카드와 그에 따른 적절한 동작 명령과의 관계를 획득한다. Asada는 뉴럴 네트워크(Neural Network : NN)를 이용하여 비선형 파라미터를 학습하는 방법을 제안하고, 시불변 선형 파라미터로는 불가능한 Peg-in-Hole 작업을 실현했다.


Skubic 연구팀은 조립 작업을 비접촉 상태에서 몇 가지 접촉 상태를 전이하고 목표 접촉 상태에 도달하는 모종의 이산 사건 과정으로 파악해 숨겨진 마르코프 모델(Hidden Markov Model : HMM)과 하이브리드 컨트롤러를 조합한 시스템을 제안하고 물체를 틀에 배치하는 작업을 실현했다. 스즈키-이타바시 연구팀과 마찬가지로 조립 과정을 이산 사건 과정으로 파악하고, 사람의 손동작과 힘 제어의 유사성에 주목해 데모 작업 데이터에서 작업자가 손끝으로 실현한 법령 준수를 추정하고, 그 파라미터의 값을 바탕으로 HMM과 하이브리드 컨트롤러를 조합한 것을 이용해 조립 기능을 모델화했다. 복사 작업이나 Peg-in-Hole 작업을 실현하고 데모 작업 데이터의 힘 제어 파라미터 추정과 작업 중의 각 모드 간의 확률적 천이 추정 모두를 실현하는 HMM을 확장한 Stochastic Swiched Impedance 모델도 제안했다. 이들 연구에서는 힘과 위치 정보를 취득하는 측정장치를 이용하여 사람의 시연 작업 데이터를 취득했다.


로봇을 원격 혹은 직접 조작함으로써 데모 작업 데이터를 취득하는 연구도 진행되고 있다. 힘 귀환형 바이래터럴 제어에 의한 원격 조작으로 사람이 로봇을 조작한 결과로부터 임피던스 중심의 궤도를 추정하고, 그 궤도를 작업 상태별로 분리하는 태스크 스킬로서 표현했다. 취득한 테스크 스킬을 로봇에 적용해 레버 핸드 밸브의 개폐, 너트 및 볼트 체결 작업을 한다.


Kormushev 연구팀은 Barret WAM을 직접 조작해 손끝 궤도를 취득하고, 교시 궤도의 편차로부터 강성을 학습해 햅틱 디바이스를 이용한 원격 조작으로 작업 중 발생할 힘을 취득하는 2단계 방법을 제안했다. 이 로봇은 다림질과 문을 열고 닫을 수 있다.


Koropouli 연구팀은 대상 작업에 필요한 힘 정보를 goal-directed dynamical system으로 표현하고, 강성이 다른 두 층의 물체를 누르는 조작이나 파는 동작을 실현했다.


Kronander 연구팀은 작업 중인 임피던스를 직접 사람의 교시로 획득하는 시스템을 제안하고, 따르는 동작과 성냥으로 불을 붙이는 작업을 실현했다. 작업 중에 로봇을 조금씩 흔들어서 임피던스 저하를 로봇을 잡는 파지력으로 임피던스의 상승을 지시할 수 있다, 로봇의 동작에 즉각 반영된다.


Montebelli 연구팀은 KUKA LWR4+ 다이렉트 티칭 기능을 사용해 로봇을 직접 조작하고, 작업 중인 반력은 힘 센서에서 취득해 교시 시스템을 구축했다.


Suomalainen 연구팀은 Montebelli 연구팀과 비슷한 시스템을 사용하여 데모 동작에서 조립에 유효한 대상물 면의 구속 방향을 추출하는 방법을 제안하고, 그 구속 방향으로 모방하는 동작을 임피던스로 제어했다.


데모에 근거한 방법의 경우 사람이 실제로 작업하기 때문에 복잡하고 다양한 작업에 적용할 수 있다.


3. 실험적 설계 방법

실험적 설계 방법의 경우 실험 및 시뮬레이션으로 제어 전략을 직접 평가하고, 최적화 및 학습을 한다. Simons 연구팀은 확률적 자동 기계를 이용하여 접촉력과 그에 따른 동작 방향의 관계를 취득했다.


Gullapalli 연구팀은 노이즈를 포함한 연속 데이터를 취급할 수 있는 강화 학습 방법(SRV Reinforcement Learning)을 제안했다. 각각 Peg-in-Hole 작업을 벌였다.


Yang 연구팀은 작업의 수준을 서서히 높이면서 학습을 진행함으로써 복잡한 작업에 대한 학습을 효율적으로 실시하는 Progressive Learning 방법을 제안하고, 공의 고속 삽입 작업을 실현했다. NN을 이용하는 연구도 하이브리드 제어 및 임피던스 제어를 대상으로 여러 가지 이루어지고 있다. 예를 들어 츠지 연구팀은 환경의 비선형 특성을 동정한 NN과 파라미터 조정과 목표 궤도를 수정하는 NN을 도입한 온라인 학습법을 제안했다.


Braun 연구팀은 각 축의 임피던스 조정을 최적 제어 문제로 취급, 2자유도의 조정 장치에서 공을 던지는 임무를 수행했다.


Buchli 연구팀은 Dynamic Motion Primitive 기반의 강화 학습 방법을 제안하고, 손끝 궤도와 작업 중인 각 축의 강성 조정의 동시 학습을 실현했다.


Phantom에서의 스위치 켜기나 휴머노이드 로봇으로 문 개폐 작업을 실시해 그 유용성을 증명했다. 실험적 설계 방법은 로봇의 자율적인 동작을 이용하기 때문에 이론적 설계 방법이나 실연에 근거한 방법을 평가하기 힘든 작업 효율을 고려한 연구가 몇 가지 진행 중이다.


Hirai 연구팀은 작업 시간이나 제어의 안정성, 작업 중 접촉력을 평가값으로 한 파라미터 최적화에 의해 평면 붙이기 작업을 실현했다.


Newman 연구팀은 GESA(Guide Evolutionary Simulated Annealing)라는 진화적 방법을 사용하여 파라미터를 최적화하고, 트랜스미션 조립 작업에서 작업 시간을 단축하는 힘 제어 파라미터를 획득했다.


야마노베 연구팀은 작업효율을 향상시키는 힘 제어 파라미터 설계를 제약 조건부 비선형 최적화 문제로 정식화하고, 동역학 시뮬레이션 기반의 파라미터 최적화했다. 6축 산업용 로봇을 이용한 Peg-in-Hole 작업 및 클러치 감합 작업에서 유용성을 보였다.


4. 논의

힘 제어를 이용하여 작업을 실현하기 위한 제어 전략의 구축에 대해서는 다양한 방법이 제안되어 다양한 작업에 적용됐다. 여기서는 얻어진 제어 전략을 다른 로봇에 재이용할 수 있는지, 또 작업 내용이나 환경 조건 등의 편차에 대해서 어느 정도 대응할 수 있는지에 주목해 논의하고 싶다.


이론적 설계 방법에서는 기본적으로 반력에 대한 동작의 관계를 작업 모델 및 해석 결과를 토대로 정식화하기 때문에, 대상 힘 제어 방식을 실현할 수 있는 로봇이면 그 결과를 쉽게 적용할 수 있다. 그러나 모델 기반 방법이기 때문에 격차와 오차에 대한 대응은 어렵다. 또 모델화의 정도가 제어 전략의 성능에 크게 의존하는 문제도 있다.


사람의 데모 데이터를 이용하는 경우도, 힘과 거동의 관계를 취득하므로 다른 로봇으로 재이용할 수 있지만, 사람과 로봇의 구조나 탐사 능력의 차이로, 사람이 실시한 결과가 로봇에게 적절하다고는 할 수 없어 작업 중의 안정성이 보증되지 않는다는 과제도 있다.


로봇을 직접 또는 원격 조작할 경우, 실험적 방법으로 제어 전략을 획득하는 경우는, 대상 로봇의 신체성에 근거한 동작이 실행되기 때문에 이 문제는 해결된다. 반면, 다른 로봇에 적용할 때는, 학습 및 최적화를 다시 추가로 실시한다는 연구가 필요하다. Howard 연구팀은 사람의 데모와 실험적 방법을 조합한 방법을 제안하고 신체성이 다른 로봇에 대한 제어에 적용했다. Apprenticeship Learning을 이용하여 데모 교시 데이터에서 대상 작업을 실현하기 위한 평가 함수를 획득한다. 평가 함수에 기초해 로봇이 동작 학습을 함으로써 실연 데이터에 내재하는 작업 달성을 위한 룰을 신체성이 다른 로봇에서도 재현할 수 있다.


실연에 근거한 방법과 실험적 방법에서는 제어 전략을 획득하는 과정의 동작 반복 속에서 발생하는 격차와 센서 노이즈 등에 대해서는 어느 정도 범위까지는 고려해서 대응할 수 있다. 반면, 대상 작업별로 몇 번이나 작업을 반복할 필요가 있는 것은 잠재적인 과제이며, 획득한 작업 전략 등의 정보를 잘 축적하고 재이용하기 위한 구조가 중요하다. 로봇에 대한 교시 데이터를 축적해서 이용하는 프레임워크 구축, 조립 등의 복잡한 시장 조작 작업의 실행 정보를 축적하고 데이터베이스화하려는 시도가 이루어지고 있다. 


획득한 업 전략의 적용 범위를 명확하게 하는 것도 모든 방법의 공통된 문제이다. End-to-End 학습의 틀에서 매니퓰레이션 동작의 학습도 이루어지고 있다. 현재는 기본적으로 화상 입력뿐이지만, 향후 역각 정보를 포함한 멀티 모달 정보를 토대로 한 작업 전략을 획득해 나감으로써 견고하고 적용 범위가 넓은 것을 얻을 수 있을 것으로 기대한다.


맺음말


여기서는 매니퓰레이션 분야의 힘 제어에 관한 연구 동향과 실용화를 설명했다. 힘 제어의 기본적인 방법은 거의 확립되어 있지만, 실제 사례는 아직 적은 것이 현실이다. 환경과 대상물과의 접촉을 수반하는 복잡하고 다양한 시장 조작 작업에서, 어떻게 힘 제어를 이용하느냐가 중요한 과제이다.


여기서는 힘 제어 파라미터 설계 등 작업을 실현하기 위한 제어 전략의 구축을 중심으로 연구 동향을 정리했다. AI 기술의 진전과, 로봇, 센서 등의 하드웨어의 발전을 배경으로 다양하고 고도의 시장 조작 작업에 나서려는 분위기가 고조되고 있다. 향후의 연구 동향에 주목한다.


힘 제어는 로보틱스의 다양한 연구 분야에서 사용하고 있다. 로봇 및 기기가 사람과 접하는 수술 로봇 등의 의료 응용, 재활, 어시스트 기기, 휴먼 로봇 상호 작용 분야, 텔레 오퍼레이션과 로코모션 등 힘 제어가 중요한 역할을 수행한다. 여기서는 이들 연구 동향을 언급하지 못한 것이 아쉽다.


---------------------

(주1) 간단히 하기 위해 한 변수의 관계성을 제어하는 방법이 선택되기 쉽다. 덤핑 제어는 강성 제어에 비해 구속 공간에서 적분효과의 안정성이 확보하기 쉽다는 이점이 있다. 


山野辺 夏樹, 산업기술종합연구소


本 記事는 日本 「計測自動制御學會」가 發行하는 「計測と制御」誌와의 著作權協定에 依據하여 提供받은 資料입니다.

목록으로

게재월 | 2018 - 03 조회 21891 추천 0

기사 미리보기