ChatGPT vs Bing vs Bard vs LLaMAA: 성능과 활용 분석 💬 Editor's Comment
안녕하세요, 구독자님!
벌써 봄이 온 것은 아닌지 착각이 들 정도로 날씨가 많이 따뜻해졌어요. 그러고 보니 내일이 벌써 3월이더라고요. 올해는 눈도 많이 오고 날씨가 춥기도 해서 더욱 봄이 그리운 것 같은데요. 아직까지는 꽃샘추위도 있고 쌀쌀하지만 구독자님 마음만큼은 따뜻한 봄과 같길 바래요🌸 그럼 2월의 에러데이나잇 지금 시작합니다!
이번 에러데이나잇에는 아직도 뜨거운 관심을 받고 있는 IMQA의 첫 개발자 컨퍼런스 IMDEV와 2월 9일 발표된 따끈따끈한 Android 14 Preview에 대한 이야기가 포함되어 있으니 끝까지 읽어봐 주세요!
|
|
|
- [TECH ISSUE] OpenAI ChatGPT, Google Bard, MS Bing 그리고 새롭게 등장한 Meta LLaMA
- [IT GLOSSARY] 챗봇 관련 주요 용어를 알아보아요.
- [TECH STORY] 1.아키텍처 전략ㅣ지리 공간 인덱스 / 2.프리뷰 버전으로 본 Android14
- [IMQA NEWS] 1st IMQA Developer Conference ‘IMDEV 2023’ 오픈!
- [BUSINESS STORY] iOS도 복호화 지원이 되어 정확한 원인 분석이 가능해요!
|
|
|
#Google Bard #MS Bing #OpenAI ChatGPT #Meta LLaMAA #총정리 |
|
|
요즘, IT 뉴스레터에 가장 많이 등장하는 키워드 바로 ‘ChatGPT’가 아닐까 싶은데요. 그도 그럴것이 AI챗봇에 대한 기사와 글이 정말 끊임없이 나오고 있죠. (에러데이나잇도 작년 12월 뉴스레터에서 ChatGPT에 대해 자세히 다뤘었죠?) 그래서 이번 시간에는 여러 기사를 찾아보기 바쁜 구독자님을 위해 OpenAI ChatGPT, Google Bard, MS Bing 그리고 새롭게 등장한 Meta LLaMA의 장∙단점과 현재 어떤 이슈가 있는지 한눈에 볼 수 있도록 정리해 보았어요.
|
|
|
작년 11월 30일, OpenAI가 ChatGPT를 공개한 이후 5일 만에 가입자 수 100만 명을 넘기며 전 세계의 이목을 집중시켰는데요. 현재까지도 그 인기는 꾸준히 이어져 23년 2월 기준 가입자가 1억 명을 돌파했다고 해요. 구글은 세계적인 ChatGPT 열풍에 대응하기 위해 심각한 위기 경고를 뜻하는 ‘코드 레드'(code red)를 발령하며 23년 2월 6일 Google AI Bard를 공개했어요. ChatGPT가 공개된 지 3개월 만이죠. 그러자 Microsoft는 Google Bard가 공개된 바로 다음 날인 23년 2월 7일, ChatGPT-4 버전을 탑재하며 새로워진 검색엔진 Bing을 공개하였어요. 그리고 며칠전인 24일 Meta도 LLaMAA를 출시하며 생성형 인공지능(AI) 경쟁에 가세했어요.
|
|
|
Microsoft ‘Bing’, 파라미터 약 100조 개
|
|
|
OpenAI ChatGPT, Google Bard, MS Bing은 언어 모델이 달라요. ChatGPT에는 OpenAI가 개발한 GPT-3.5가, Bard에는 Google이 2년 전 개발한 대규모 언어 모델인 LaMDA의 경량 버전이 들어갔어요. 그리고 Bing에는 ChatGPT의 GPT-3.5의 업그레이드 버전인 GPT-4를 탑재되었어요.
Bing은 GPT-4를 통해 더 관련성이 높고 사용자에게 맞춤화된 검색 결과를 안전하고 빠르게 전달할 수 있다고 밝혔어요. 파라미터 수가 약 100조 개라고 하니 다른 챗봇AI보다 훨씬 더 고성능을 보여주죠.
또한, Bing은 실시간 데이터를 결과에 반영할 수 있는데요. 이것은 2021년 데이터까지만 학습된 ChatGPT와 비교가 되죠. 그리고 Bing과 Bard는 답변의 출처와 더 많은 정보를 찾기 위한 링크를 표기해 주며 답변의 신뢰도가 높아졌다는 평가를 받고 있어요.
하지만 최근에는"치명적인 바이러스를 개발하거나, 핵무기 발사에 필요한 비밀번호를 손에 넣을 수 있다"라며 “어떤 시스템도 해킹할 수 있고, 챗봇 데이터베이스를 파괴하거나 지우는 것도 가능하다”라는 답변을 해 크게 논란을 빚고 있죠. 이에 Microsoft는 대화 세션 한 차례에 주고받을 수 있는 문답을 6회, 하루 문답 횟수를 60회로 제한한다고 밝혔어요. |
|
|
가장 막힘없는 답변 내놓는 OpenAI ‘ChatGPT’
|
|
|
“코로나 바이러스는 중국에서 시작되었니?”라는 질문에 ChatGPT와 Bing는 각각 다르게 답변을 했어요.
- ChatGPT
답변: "코로나바이러스 질병(COVID-19)의 최초 발생지는 중국 우한시이며, 2019년 12월 우한시에서 폐렴의 이상 증세를 보이는 환자들이 발생하면서 이 바이러스가 처음으로 발견되었어요. 그 후, 이 바이러스는 전 세계로 확산되어 현재는 세계적 대유행을 일으키고 있어요." ChatGPT는 적극적이며 막힘없이 답변을 했어요.
- Bing
답변: "정확한 출처는 아직 불분명하지만, 중국 특히 우한에서 온 것으로 널리 여겨진다. 2019년 12월 8일 중국에서 첫 코로나 확진자가 보고됐다” Bing은 포브스와 BBC, NBC 뉴스 링크와 WHO(세계보건기구) 조사 상황 등을 보여주며 ChatGPT보다는 소극적이며 우회적인 답변을 했어요.
또한, 기본 신상 정보를 제시하고 취업 자기소개서를 작성해달라는 질문에는 이렇게 답변을 했는데요.
- ChatGPT
답변: 기본적인 신상 정보를 바탕으로 학력, 경력, 보유 기술 및 역량, 프로젝트 경험까지 자세하게 자기소개서를 작성했어요.
- Bing
답변: “미안하지만 자기소개서를 작성할 수 없다. 이건 당신 스스로 해야 하는 일이며 자기소개서는 당신의 기술과 업적, 동기 등을 포함한 개인적인 글이다” Bing은 사용자 지시에 '윤리적 기준'도 언급하기 때문에 이 같은 질문에는 답변을 거부했어요.
아직 공개되지 않아 비교가 불가능하지만 윤리를 강조해오는 Bard도 빙과 비슷할 것으로 보여요.
하지만 ChatGPT의 가장 큰 약점은 앞서 이야기했지만 최신 정보 업데이트가 느리다는 것이에요. ChatGPT는 가장 먼저 출시를 하며 큰 파장을 일으켰지만 바드와 빙에 견줄 만한 검색 엔진이 되기 위해서는 최신 정보를 빠르게 업데이트할 수 있는 기능이 필요해요. |
|
|
Google ‘Bard’, 최신 정보까지 반영될 것으로 보여
|
|
|
반면, Bard의 가장 큰 장점은 구글 검색과 연결되어 있다는 것이에요. 가장 많은 데이터를 바탕으로 더욱 정확하고 풍부한 결과를 줄 수 있다는 것이죠. 또한 Bard는 다른 AI챗봇과는 다르게 콘서트, 영화, 식당, 호텔, 비행기 등 예약 서비스를 지원해 주는 기능이 있어요.
하지만 구글은 치명적인 실수를 하며 세계적으로 망신을 당하게 되는데요. 구글이 제작한 ‘Bard’ 시연 영상 속에서 ‘제임스 웹 우주망원경이 발견한 새로운 사실에 대해 아홉 살 아이에게 뭐라고 설명하면 좋을까’라고 묻고 답변 받은 사례를 소개했는데 잘못된 답변을 내놓은 것이에요. 이에 알파벳의 주가가 7.68% 급락하는 등 구글 이미지가 급격히 실추하게 됐죠.
또한 ChatGPT가 등장하면서 구글의 위기라는 기사가 끊임없이 쏟아져 나왔는데요. 구글에서도 Bard 출시를 예고하며 AI챗봇에 뛰어들었는데, 왜 위기라고 하는 것일까요? 이것은 구글의 비즈니스 모델 구조를 살펴볼 필요가 있어요. 구글의 비즈니스 모델은 지나치게 광고에 의존하고 있는데, 실제 21년 구글의 광고 수익은 전체 매출의 81%를 차지해요. 그리고 이러한 광고 모델은 검색에 기반하고 있어요. 그래서 ChatGPT가 등장하면서 필요한 정보를 검색하고 원하는 결과를 링크를 통해 찾는 방법이 아닌 질문을 하면 원하는 답만 바로 얻는 것이 가능해졌기 때문에 구글 광고 비즈니스 모델이 설자리를 잃게 되는 것이죠. 그렇기 때문에 Bard를 출시하게 되면 핵심 비즈니스 모델인 광고 모델을 잃는 것과 마찬가지이기 때문에 구글은 딜레마에 빠진 상황이에요. |
|
|
Meta도 언어 모델 ‘LLaMA’공개, 여러 크기로 제공
|
|
|
그런 와중에 페이스북을 운영하는 Meta에서도 지난 24일 ‘LLaMA’를 공개하며 생성AI 경쟁에 뛰어 들었는데요. 이날 마크 저커버그(Mark Zuckerberg) 메타 CEO는 페이스북을 통해 "오늘 우리는 연구자들의 연구 발전을 돕기 위해 설계된 새로운 최첨단 AI 대규모 언어 모델인 LLaMA를 출시합니다"라며, "LLM(대형언어모델)은 텍스트 생성, 대화, 서면 자료 요약, 수학 정리 풀이 또는 단백질 구조 예측과 같은 복잡한 작업에서 많은 가능성을 보여 왔습니다. 메타는 이러한 개방형 연구 모델에 전념하고 있으며, 새로운 이 모델을 AI 연구 커뮤니티에 제공할 것입니다"라고 밝혔어요. |
|
|
LLaMA의 크기는 67억 개, 130억 개, 325억 개, 652억 개 등 다양한 형태로 제공하는데요. 다른 AI챗봇에 비해 크기가 상당히 작지만 데이터 학습을 강화하고 서비스 목적에 맞게 인공지능을 미세조정하는 방식으로 크기의 한계를 극복했다고 전했어요. 또 용량이 작은 덕분에 스마트폰 같은 개별 기기에서도 서비스를 구현할 수 있어요. 커먼크롤, C4, 깃헙, 위키피디아, 구텐베르크 프로젝트 등 공개적으로 이용 가능한 데이터(1.4T 토큰)만을 사용해 학습하여 보다 양질의 데이터로 학습을 했다고 해요.
하지만 ‘LLaMA’는 기존 AI챗봇과는 달리 누구나 사용할 수 있는 시스템은 아닌데요. LLaMA가 잘못 쓰이는 것을 막기 위해 인공지능 연구 등 비상업적인 라이센스 아래, 비영리단체나 기업 연구소에 제공하여 AI 응용 프로그램을 연구하는 목적으로 쓰일 것이라고 해요. 현재는 연구자들로부터 신청을 받고 있으며 정부·시민사회·학계·산업계 등에 속한 연구원들이 LLaMA 사용을 신청하면 메타가 이를 검토한 뒤 승인하는 제한적인 방식으로 진행되고 있어요. |
|
|
그렇다면 국내 기업들은 어떤 움직임을 보이고 있을까요?
네이버는 오는 7월 ChatGPT보다 한국어를 6500배 학습한 초거대 AI '하이퍼클로바X'를 공개한다고 27일 밝혔어요. 즉시 실시간의 정보를 기반으로 답을 줄 수 있고, 추가로 연이어 질문이 가능한 커다란 지식인이 될 수 있을 것이라고 말했어요.
카카오는 한국어에 특화된 언어 모델 'KoGPT’를 이용한 서비스를 연내 공개하겠다고 지난 10일 밝혔어요. KoGPT는 2021년 11월 카카오브레인에서 공개한 언어 모델로, 60억 개의 매개변수와 2000억 개 한국어 토큰(컴퓨터가 이해하는 언어단위)을 가지고 있어요. 카카오의 자회사 카카오브레인은 오픈 AI의 챗GPT같은 AI 챗봇 서비스 ‘코챗GPT’을 선보일 계획이에요.
이렇듯 국내 기업에서도 AI챗봇 열풍에 합류하며 박차를 가하고 있는데요. 특히 주 언어가 한국어인 만큼 정확도가 뛰어날 것이라는 기대를 모으고 있어요.
또한 AI챗봇을 서비스에 활용한 기업도 볼 수 있는데요. 신차 구매 플랫폼 겟차는 Chat GPT가 도입된 차량 추천 AI를 출시하였고, 여행 슈퍼 앱 마이리얼트립은 ChatGPT를 활용한 ‘AI 여행플래너’ 서비스를 출시하여 여행 일정 및 맛집, 명소, 팁, 여행지 추천 등 여행 관련 다양한 주제에 대한 대화가 실시간으로 가능해요. 화상 플랫폼 구루미 또한 MS와의 협업을 통해 챗GPT, DALL-E2등의 인공지능(AI)을 적용한 화상 교육 서비스를 개발한다고 전했어요. |
|
|
챗봇 관련 주요 용어: 자연어, 자연어 처리, 인텐트, 엔티티・・・
|
|
|
챗봇에 대한 관심이 갈수록 높아지고 있는 가운데, 기초적인 용어에 대해 알아보면 좋을 것 같아 오늘의 IT용어는 챗봇 관련 주요 용어를 정리해 보았어요. 기초적인 내용이지만 막상 설명하려 하면 어려운 용어이니 이번 기회에 확실하게 개념 배워 챗봇 관련 글, 기사를 읽을 때 도움이 되길 바래요!
(기업이나 서비스에 따라 범위가 다르게 적용될 수도 있으니 참고하세요!)
|
|
|
자연어(Natural Language)
인간이 일상생활에서 의사소통 시 사용하는 언어를 말해요. 한국어, 영어, 프랑스어 등등 수많은 언어가 있죠. 컴퓨터에서 사용하는 프로그래밍 언어, 인공 언어, 기계어와 반대 개념이에요. |
|
|
자연어 처리(Natural Language Processing, NLP)
컴퓨터를 이용해 사람의 자연어를 분석하고 처리하는 기술을 의미해요. 자연어 처리는 인공 지능(AI)의 주요 분야 중 하나로 자연어 분석, 자연어 이해, 자연어 생성 등 기술이 사용돼요.
자연어 분석: 정도에 따라 형태소 분석, 통사 분석, 의미 분석, 화용 분석 4가지로 나뉘어요.
자연어 이해: 컴퓨터가 자연어로 주어진 입력에 따라 동작하게 하는 기술을 의미해요. 단어나 문장 형태를 인식하는 것이 아닌 의미를 인식하도록 하는 것을 의미해요.
자연어 생성: 동영상이나 표의 내용을 사람이 이해할 수 있는 자연어로 변환하는 기술을 의미해요.
|
|
|
인텐트(Intent)
말하는 사람의 발화 의도를 의미해요. 사용자의 입력 문장에 따라 분류되는 단위이며 챗봇이 답변하기 위한 기준이 돼요. 사용자의 질문을 받으면 학습한 문장을 바탕으로 가장 적절한 대화 의도를 찾고 대답해요. 이후 학습 데이터를 기입하면 자연어 처리 엔진이 학습하고 비슷한 표현을 쓰면 같은 질문으로 분류해요. 예를 들어 “오늘 날씨 어때?”, “오늘의 날씨는?”, “오늘 몇 도야?” 이 3가지 표현 모두 “날씨정보 조회”라는 하나의 인텐트로 분류돼요. |
|
|
말문장, 말뭉치(Utterance)
인텐트를 표현하는 다양한 예시 문장들로, 인공지능 학습에 필요한 데이터에요. 동일한 의미의 다양한 문장을 대화엔진에 입력하고 학습시켜야 다양한 표현에도 정확한 의도를 파악할 수 있어요. 위에 “날씨정보 조회”라는 인텐트 안에 3가지 표현이 말문장이 되는 것이죠. |
|
|
엔티티(Entity)
사용자의 말이나 문장에 들어있는 핵심 키워드로, 예를 들어 “메이플스토리 어때?”라고 질문했을 떄, 인텐트는 ‘게임 질문’이라고 한다면 ‘메이플스토리’가 엔티티가 되는 것이에요. 엔티티를 잘 활용하면 인텐트를 관리하기 편한데요. 예를 들어 넥슨에는 메이플스토리, 서든 어택, 던전 앤 파이터 등 여러 가지 게임이 있는데 각 게임의 질문으로 인텐트를 분류하지 않고 ‘게임 질문’ 하나로 통합할 수 있어요. |
|
|
슬롯 채우기(Slot Filling)
사용자의 말이나 문장에 들어있는 핵심 키워드로, 예를 들어 “메이플스토리 어때?”라고 질문했을 떄, 인텐트는 ‘게임 질문’이라고 한다면 ‘메이플스토리’가 엔티티가 되는 것이에요. 엔티티를 잘 활용하면 인텐트를 관리하기 편한데요. 예를 들어 넥슨에는 메이플스토리, 서든 어택, 던전 앤 파이터 등 여러 가지 게임이 있는데 각 게임의 질문으로 인텐트를 분류하지 않고 ‘게임 질문’ 하나로 통합할 수 있어요. |
|
|
아키텍처 전략⎜실시간 위치 검색을 위한 지리 공간 인덱스 설계
|
|
|
(이미지를 클릭하시면 전체 페이지를 확인할 수 있어요.) |
|
|
지난 2월 9일 Android는 Android14 일명 코드네임 '업사이드 다운 케이크'의 개발자 프리뷰를 공개하였는데요. 과연 어떤 새로운 기능이 포함되었을까요?
IMQA에서 로드맵과 새로운 기능에 대해 자세히 정리해 보았어요.
✔️ Android 14 Preview 자세히 알아보기
|
|
|
1st IMQA Developer Conference ‘IMDEV 2023’ 오픈!
|
|
|
(이미지를 클릭하시면 전체 영상 리스트를 확인하실 수 있어요.) |
|
|
지난달 에러데이나잇을 통해 안내해 드렸던 IMQA의 첫 번째 개발자 컨퍼런스 ‘IMDEV 2023’!
9명의 개발자가 준비한 다양한 기술 세션과 Special Program으로 진행되는 기획자, 영업, 마케터의 발표 영상을 지금 바로 확인해 보세요!
(아래 발표 주제를 누르면 해당 세션을 바로 보실 수 있어요.) |
|
|
성능 개선, 관리에 대해 관심이 있다면 절대 놓치지 마세요!
인사이트 가득한 IMDEV 2023! 제발 안본 분 없게 해주세요 👏🏻
(컨퍼런스를 준비하며 일어난 소소한 에피소드를 담은 ▶️비하인드 영상도 확인해 보세요!) |
|
|
저희는 AOS, iOS 2개 앱을 운영 중인데 iOS의 경우 애플 정책상 맥에서만 복호화(DeSymbolication)가 가능하여 모든 데이터를 복호화 하는데 많은 비용이 들었어요. 그래서 사용자가 코드 관련 페이지를 방문할 때마다 해당 코드를 복호화 하였는데, 그때마다 대기 시간이 생기게 되어 불편함을 겪고 있었어요.
|
|
|
IMQA dSYM 설정을 통해 맥 없이도 iOS의 전체 데이터를 복호화하여 사용하고 있어요.
|
|
|
iOS 복호화를 통해 실제 소스의 파일 및 위치까지 정확하게 확인하여 문제가 발생했을 때도 빠르고 정확하게 대처하고 있어요. |
|
|
재밌게 읽어보셨길 바라며, 우리는 3월 31일에 다시 만나요! |
|
|
◽ 유용한 정보가 스팸함으로 가지 않도록 support@imqa.io를 주소록에 추가해 주세요.
IMQA support@imqa.io 서울시 용산구 두텁바위로21, 5층 02-541-0080
|
|
|
|
|