MS 빙 챗(Bing Chat) v.s Google 바드(Bard)
지난 10일 구글(Google)이 생성형 인공지능(Generative AI)인 바드(Bard)를 출시하면서, 본격적으로 마이크로소프트(MS)의 빙 챗(Bing Chat)과 구글 바드의 대립 구도가 형성되었습니다.
확실히 MS가 검색과 AI를 결합한 AI 챗 봇인 빙 챗을 출시한 이후, 구글이 위기감을 느낀 것인지 발 빠르게 실험 버전의 바드를 출시했습니다. 지난 포스팅에서 말씀드렸듯이, 구글이 바드에 한국어를 먼저 적용하기도 했습니다.
지난 포스팅 참고 : 대화형 인공지능(AI) 서비스의 활용 - 검색 서비스와 챗봇의 결합
대화형 AI(인공지능) 서비스의 활용 - 검색 서비스와 챗봇의 결합
기존의 AI 인공지능들과 챗GPT의 차이점은 무엇인가요? 챗GPT가 등장하기 이전에도 AI 인공지능 서비스는 있었습니다. 대표적인 예시로 인공지능 스피커가 있습니다. SKT의 NUGU, KT의 기가지니, 네이
itdesign.zyuddo.com
이번에는 빙 챗과 바드의 특징들을 사용자 경험(UX) 관점에서 분석해 보겠습니다.
마이크로소프트 빙 챗 이용 방법
UX 분석 전에 먼저 빙 챗과 바드를 직접 사용해 보실 수 있도록 이용 방법을 안내해 드리겠습니다.
먼저 빙 챗은 Microsoft Edge에서 이용 가능합니다. 컴퓨터에 Edge가 없는 분들은 새로 다운로드해야 합니다.
아래 배너를 클릭하여 마이크로소프트 엣지를 다운로드할 수 있습니다.
마이크로소프트 엣지를 다운로드하고 실행하면, 아주 쉽게 Bing AI를 찾을 수 있습니다. 검색창에 검색을 해도 되고, 우측의 퀵메뉴를 통해서도 Bing을 찾을 수 있습니다. 마이크로소프트 엣지를 처음 사용하시는 분들은, 사파리나 구글에 계정 로그인할 때처럼 로그인을 한 다음에 이용할 수 있습니다!
아래 스크린샷을 통해 다양하게 Bing을 실행시키는 방법을 확인할 수 있습니다. Bing을 실행시키고 나서는 챗GPT를 이용할 때처럼 자유롭게 질문을 입력창에 적어주시면 됩니다.
구글 바드 이용 방법
구글 바드는 브라우저를 가리지 않고 사용해 볼 수 있습니다. 사파리, 구글, 엣지 등 사용하고 있는 기존 브라우저에서 '구글 바드'를 검색하면 아래 사이트에 접속할 수 있습니다.
Bard
Bard is your creative and helpful collaborator to supercharge your imagination, boost productivity, and bring ideas to life.
bard.google.com
빙 챗 v.s 바드 비교 전, 챗봇 사용자 경험 설계 가이드에 대해 알아보자
빙 챗과 바드는 기본적으로 대화형 AI이기 때문에 챗봇의 형태를 띠고 있습니다.
요즘에는 여러 기업에서 챗봇 서비스를 많이 제공하고 있기 때문에, 챗봇이 무엇인지 잘 알고 계실 것 같습니다.
다른 기업에서 제공하는 챗봇 서비스들은 보통 제한된 기능에 대한 답변만 제공하는 경우가 많은데, 빙 챗과 바드는 거대언어모델(LLM)을 기반으로 했고 방대한 인터넷 검색 자료들을 학습했기 때문에, 기존의 챗봇 서비스들보다 훨씬 더 자유롭고 풍부한 대화가 가능하다는 차이점이 있습니다.
빙 챗과 바드도 기본적인 챗봇의 사용자 경험 설계 가이드를 준수하고 있습니다.
상세 비교 전에 널리 알려져 있는 챗봇의 사용자 경험 설계 가이드를 먼저 소개해 드리겠습니다.
삼성 SDS CX혁신팀에서 정리한 UX 실무자를 위한 챗봇 설계 가이드입니다.
https://post.naver.com/viewer/postView.naver?volumeNo=32458307&memberNo=36733075&vType=VERTICAL
구글에 'chatbot ux', 'chatbot design' 등으로 검색해도 매우 많은 자료를 볼 수 있는데, 한국어로 잘 정리된 내용이 있어 공유합니다.
챗봇 설계 A to Z - UX 실무자를 위한 챗봇 설계 가이드
[BY 삼성SDS] 삼성SDS CX혁신팀 사용자에게 챗봇은 필요한 순간에 나타나, 특별한 학습 없이 쉽게 사...
m.post.naver.com
가이드 내용을 요약하면 다음과 같습니다.
그럼 아래 챗봇 UX 가이드라인을 참고하여 빙 챗과 바드의 사용자 경험(UX)을 비교 분석해 보겠습니다.
챗봇 UX 가이드 - 다음과 같은 사항을 고려
1. 언제 사용자에게 나타나야 할까?
* 챗봇의 웹 결합 유형 : 분리형, 삽입형, 일체형
2. 어떻게 말을 걸어야 할까?
* 할 수 있는 일 명확하게 알리기
* 호기심을 자극하는 말로 시작하기
* 첫 대화 턴이 끝나기 전에 최대한 사용자에 대해 알아내기
3. 어떻게 대화를 진행해야 사용자가 답답하지 않을까?
* 사용자의 선택을 의도적으로 제한하기
* 언제라도 대화 처음 혹은 그전으로 돌아갈 수 있는 길을 만들어두기
4. 어떻게 대화를 종료해야 좋은 인상을 남길까?
* 최대한 자연스럽게 사람한테 넘기기 (실제 사람과 진행하는 라이브챗으로 연결)
* 전략적으로 사용자의 피드백을 수집하기
5. 대화의 재시작 - 어떻게 관계를 이어나갈까?
* 대화 히스토리를 보여주거나 사용자와 챗봇과의 관계가 끊이지 않고 계속해서 신뢰를 쌓아가기
빙 챗과 바드, 챗봇 UX 가이드라인을 기준으로 비교 분석
1. 언제 사용자에게 나타나야 할까?
- 빙 챗 : 빙 챗은 삽입형과 일체형을 모두 지원합니다. 왼쪽의 그림은 삽입형, 오른쪽 그림은 일체형입니다.
- 바드 : 바드는 일체형입니다.
삽입형과 일체형 중 어떤 UXUI가 이 서비스에 더 적합할까요? 대화형 AI와 대화를 나누는데 집중하려면 아무래도 전체 화면으로 지원하는 일체형이 더 편할 것 같습니다. AI의 답변이 줄글 형태로 긴 편인데, 차지하는 디스플레이 영역이 좁으면 답변을 읽기 힘들 수도 있습니다.
삽입형은 멀티태스킹에 도움이 될 것 같은데, 인터넷 검색을 하면서 AI와의 대화를 동시에 하는 상황이 일반적으로 많이 발생할까요? 내가 직접 검색한 결과와 AI의 답변을 비교할 때는 유용하겠지만, 그러한 경우가 많이 발생할지는 모르겠습니다. 그리고 PC 웹에서는 화면 분할이나 이동이 모바일보다 상대적으로 훨씬 자유롭기 때문에 굳이 브라우저 내에서 검색 화면과 빙 챗 화면을 나누어 사용하지 않을 것 같다는 생각이 듭니다.
하지만 여러 모드를 다양하게 지원한다는 점은 사용자에게 편리함을 제공할 수 있습니다. 심심이보다 발전된 형태의 거대언어모델(LLM) 기반 대화형 AI라는 서비스 자체가 출시된 지 얼마 되지 않았기 때문에, 아직 사용자들도 이것을 어떤 방식으로 사용하는 것이 가장 효과적인지 습관이 잡히지 않았을 수 있습니다. 여러 모드를 지원하여 어떠한 방식으로든지 사용자에게 유용성을 제공하려는 시도는 긍정적으로 평가할 수 있겠습니다.
2. 어떻게 말을 걸어야 할까?
- 빙 챗 : 빙 챗에서는 시작 화면에서 재미있는 기능을 제공합니다. 바로 대화 스타일을 선택하는 것입니다!
대화 스타일은 "보다 창의적인", "보다 균형 있는", "보다 정밀한" 3가지로 구분됩니다.
- 보다 창의적인 : 독창적이고 창의적인 대화 (ex. 해적의 마음으로 외부 악어에 대한 단시 쓰기)
- 보다 균형 있는 : 유익하고 친근한 대화 (ex. 가장 잘 팔리는 반려동물 청소기 3개의 장단점은 무엇인가요?)
- 보다 정밀한 : 간결하고 단도직입적인 대화 (ex. 주황색만 먹는 까다로운 입맛의 유아를 위해 어떤 음식을 만들 수 있을까요?)
대화 스타일을 변경할 때마다 배경색이 변경되어 매우 직관적으로 느껴집니다. 그리고 대화 스타일에 대한 설명이 마우스를 호버 하면 버블로 나타나고, 대화 스타일별 질문 예시도 메인 화면에 잘 정리되어 한눈에 보이고 있습니다.
빙 챗이 할 수 있는 일이 무엇인지, 빙 챗의 기능을 직관적이면서도 매력적이고 호기심을 자극하는 방식으로 잘 보여주는 디자인입니다. 이러한 형태의 신규 서비스가 익숙하지 않은 사용자가 빙 챗을 이해하는데 도움이 되는 온보딩 방식이라고 볼 수 있겠습니다.
- 바드 : 바드 또한 온보딩 화면에서 바드가 할 수 있는 일이 무엇인지, 구체적인 질문의 형태를 통해 안내하고 있습니다.
아래 스크린샷 이미지에서 빨간 박스를 친 부분에 모션이 적용되어 질문이 계속 바뀝니다. 코커 스패니얼과 골든 리트리버의 성격 비교, 여행 계획, 외국어 공부 계획, 올해 패션 트렌드, 제품의 장단점 등을 알려줄 수 있다고 말하고 있습니다. 바드가 할 수 있는 일이 무엇인지 간편하고 이해하기 쉽게 안내하고 있습니다.
위 스크린샷은 바드에 처음 접속했을 때 뜨는 화면이고, 아래 스크린샷은 약관 동의 이후에 뜨게 되는 메인 화면입니다. 위 화면은 최초 1회만 볼 수 있는 것이고, 그 이후로부터는 쭉 아래 안내 화면이 뜨는 것이지요.
상단 화면과 마찬가지로 여러 질문 샘플을 '참고용'으로 제공하고 있습니다.
"어떻게 시작해야 할지 잘 모르시겠다면 다음 예를 참고해 보세요."라는 문구가 아직 대다수의 이용자들이 이 서비스에 익숙하지 않다는 점을 염두에 둔 발언으로 이해됩니다.
3. 어떻게 대화를 진행해야 사용자가 답답하지 않을까?
- 빙 챗 : 입력창에 글자를 입력하면 '자동완성' 기능을 지원하며, 답변이 생성되는 동안 프로그레스 인터랙션을 제공하고 있습니다. 또한 답변의 정보에 대한 출처와 다음 예상되는 질문을 미리 보기로 지원하기도 합니다. 그리고 언제든지 대화를 종료하거나 새로운 주제의 대화를 진행할 수 있도록 버튼을 제공하고 있으며 이전 대화 목록으로 돌아갈 수 있게끔 이전 대화 리스트를 우측에 보여줍니다.
글자 자동완성 기능
자동완성 기능은 편리할 때도 있지만 사용자의 의도를 정확하게 맞추기 어려울 때도 많습니다. 한국어는 다른 언어에 비해 상대적으로 글자수로 의미를 표현할 수 있어서 한국에서는 자동완성 기능을 선호하는 분이 많지 않은 것 같습니다. 모국어가 다른 언어였다면 유용하게 사용했을까요? 대부분 자동완성 기능은 해제하고 사용하는 경우가 많을 것 같은데, 빙 챗은 어떤 의도로 자동완성 기능을 제공하는 것일까요?
휴대폰을 통한 채팅이나 정보 입력에서는 반복적인 정보를 자주 주고받기도 합니다. 예를 들어서 나의 이메일 주소나 휴대폰 번호와 같은 개인 정보는 자주 입력하는 경우가 많아 자동완성 텍스트로 등록하여 사용하시는 분들이 있습니다. 그러나 검색 채팅에서는 같은 단어를 자주 입력할 상황이 발생할까요?
답변이 생성되는 동안 프로그레스 인터랙션
질문을 입력한 다음 바로 답변이 나오지는 않습니다. 빙 챗이 "검색 중"과 "생성하는 중"이라고 말하고 있습니다. 사용자 만족도에 영향을 미치는 가장 중요한 요인은 시스템 반응성입니다. 시스템 반응성은 사용자의 조작에 반응하는 속도, 사용자에게 현재 상태에 대해 지속적으로 알려주는 것을 의미합니다. 보통 대화 중 일어날 수 있는 최대 침묵 시간은 1초입니다. 1초 이상 침묵하면 사용자들은 무슨 일이 생긴 것인지 궁금해하기 때문에, 시스템은 1초 이내로 요청을 처리하거나 그렇지 못할 경우 프로그레스 인터랙션이 적극 활용됩니다.
빙 챗 또한 답변 과정에서 이러한 프로그레스 인터랙션을 적극 활용하고 있습니다. 챗GPT나 바드의 경우, 답변이 생성되고 있음을 커서 깜빡임을 통해 표현하는데 빙 챗은 조금 더 적극적으로 시스템 반응성을 알리고 있음을 확인할 수 있습니다.
정보에 대한 출처 안내, 예상되는 질문 미리 보기
챗GPT, 바드와 빙 챗의 가장 큰 차이점 중 하나는 정보에 대한 출처를 직접적으로 안내하는 것입니다.
빙 챗에게 직접 '챗GPT와 빙의 차이'가 무엇인지 물어보기도 했는데요. 빙은 이렇게 답변했습니다. "챗GPT는 대화를 학습하여 챗봇을 만들기 위해 사용되고, 빙은 웹을 학습하여 검색 엔진을 만들기 위해 사용됩니다." 빙의 답변을 통해 빙이 정보에 대한 출처를 자세히 안내하는 것에 대한 힌트를 얻을 수 있었습니다. 빙 챗의 성격은 보다 검색 엔진의 성격을 띠고 있으며, 그를 보조하는 수단으로써 활용되고자 하는 것입니다.
그리고 이전 대화와 연결이 되는 예상되는 추가 질문을 미리 보기 형태로 제안하고 있습니다. 이 또한 사용자가 검색이라는 행위를 하는데 도움을 줄 수 있는 수단으로 볼 수 있습니다.
새 토픽과 대화 히스토리
빙 챗은 새로운 대화를 시작할 수 있는 '새 토픽' 버튼과 대화 히스토리를 대화 화면에서 바로 찾을 수 있는 화면 인터페이스를 보여주고 있습니다. 이를 통해 사용자는 챗봇과 대화 중에 언제라도 편리하게 다른 길로 이동할 수 있습니다.
- 바드 : 챗GPT와 빙 챗과 비교되는 바드의 특징은 여러 답변을 제공한다는 것입니다. '다른 답안 보기' 기능을 통해 여러 가지 형태의 답변을 볼 수 있습니다. 그리고 바드에서도 마찬가지로 쉽게 새 대화를 시작할 수 있고 대화 히스토리를 확인하여 이전 대화로 돌아갈 수도 있습니다.
다른 답안 보기
바드는 한 번 답변을 생성할 때 답안을 3가지 제공합니다. 발화 스타일이 달라지지는 않고 제공하는 정보가 조금씩 달라집니다. 예를 들어 답안 1에서는 로돌프 지나스 교수의 직위와 수상내역을 중점적으로 설명합니다. 답안 2에서는 로돌프 지나스 교수의 주요 연구 내용을 알려줍니다. 답안 3에서는 답안 1과 2에 나왔던 내용을 조금 더 짧게 요약하여 설명합니다.
특정 인물에 대한 3가지 답안은 크게 차이가 없었습니다. 그래서 '맛있는 치킨 요리를 만드는 레시피'에 대해서 다시 질문을 했습니다. 이번엔 서로 완전히 다른 3가지 요리 레시피가 나옵니다. 사용자가 어떤 질문을 하느냐에 따라서 이 기능을 유용하게 사용할 수도 있고, 그렇지 않을 수도 있겠네요.
새 토픽과 대화 히스토리
'채팅 재설정'을 누르면 새로운 채팅을 시작할 수 있습니다. 챗GPT, 빙 챗과 다르게 바드는 이전 대화 목록을 메인 화면에서 리스트 형식으로 제공하지 않고 있습니다. 대신 'Bard 활동'이라는 버튼을 누르면 사용자가 했던 질문들을 일자별로 확인할 수 있습니다. (이전 대화 내역을 불러오는 것은 안됩니다.) 그리고 원한다면 검색 내역을 삭제할 수도 있습니다.
구글 바드는 다른 대화형 AI와 다르게 사용자와 AI 간 대화 내역을 '개인 정보' 측면으로 바라보고 있음을 명시합니다. 내가 입력한 프롬프트와 받은 답변을 저장할 것인지, 저장하지 않을 것인지 '선택'할 수 있는 권한을 제공합니다. 구글이 사용자의 개인 정보 관리에 특히 신경 쓰고 있는 특징이 드러납니다. 실제로 FAQ 페이지에서 구글이 바드를 통해 데이터를 어떻게 수집하는지, 수집된 데이터는 어떻게 사용되는지 등에 대한 자세한 답변을 제공하고 있습니다.
아직은 Bard 대화가 광고 목적으로 사용되지 않으며, 향후 이러한 접근 방식에 변화가 있을 경우 이에 대해 명확하게 안내해 드리겠다는 답변이 눈에 띕니다.
직접 빙 챗과 바드를 사용해 보며 서비스들의 서로 다른 특성에 대해서 살펴보았습니다. 확실히 구현된 기능을 찬찬히 살펴보니, 마이크로소프트와 구글이 각각 어떤 의도를 가지고 서비스를 만들었고 대화형 AI를 어떤 시각으로 바라보고 있는지 특징이 드러나는 것 같습니다.
다음 편에서는 이어서 4. 어떻게 대화를 종료해야 좋은 인상을 남길까? 와 5. 대화의 재시작은 어떻게 이어나갈 수 있을까? 측면에서 분석해 보겠습니다.
참고로 구글 바드는 현재 실험 버전이기 때문에 지속적인 패치와 기능 변경이 있을 것으로 예상됩니다. 빙 챗 또한 지난 달에 사용해 봤을 때와 조금 다릅니다. 같은 질문을 했는데 다른 방식으로 답변하는 것을 보아하니, 서비스 운영 중에도 피드백을 받아 계속 개선 중인 것으로 보입니다.
제가 분석한 내용 외에 빙 챗과 바드를 사용하면서 흥미로운 점이나 개선해야 할 점을 발견했다면, 댓글로 공유 부탁 드립니다.
'비전공생이 말하는 IT | 디자인 이야기' 카테고리의 다른 글
네리 옥스먼(Neri Oxman)의 KCC(Krebs Cycle of Creativity) (0) | 2023.06.09 |
---|---|
허버트 사이먼(Herbert Simon)과 문제해결과정으로서의 디자인 (0) | 2023.06.06 |
한국 기업 생성형 AI 번역 서비스 플리토 사용 방법, 이용 후기, 주식 전망 (0) | 2023.06.05 |
챗GPT의 할루시네이션 현상 개선과 사용 시 주의점 (feat. 빙 챗 & 바드) (0) | 2023.05.25 |
MS 빙 챗(Bing Chat)과 구글 바드(Bard)의 대화형 AI 사용자 경험(UX) 비교 - 2편 (0) | 2023.05.24 |