본문 바로가기

궁금한 ai 놈들

놀라운 AskUp 이미지 분석과 해석 능력

이미지를 보낸 후 "해석"을 요청해 보세요. 
놀라운 능력을 보여줍니다. 

 

최근에 핫한 카톡판 챗GPT 'AskUp'을 홍보하는 키워드가 이미지 파일을 인식하는 '눈 달린 ChatGPT'라고 하지요. 카카오톡에 AskUp 친구추가 방법은 많은 블로그나 공식 사이트에서 더 자세히 설명되어 있으니 아래 링크로 대신합니다.

 

AskUp(아숙업) 공식 사용 가이드 #1 - 친구 추가편 — Upstage

"AskUp은 챗GPT를 기반으로 업스테이지의 광학문자판독(OCR) 기술을 결합해 사용자가 문서 사진을 찍거나 전송하면 이미지 내 텍스트를 이해하고 답변한다. 최근 출시된 차세대 언어 모델 GPT-4도 적용해 답변 능력을 한층 높였다."
- 머니투데이 기사 발췌

 

위 업스테이지 홍보 기사가 AskUp의 능력을 잘 설명해 주는 글이라 생각합니다. 저도 위 내용처럼 잘 사용하고 있다가 색다른 능력을 알게 되어 간단하게 정리해 봅니다.

 

  1. ChatGPT 일상 대화처럼 자연어 질문/답변 능력
  2. 이미지/사진을 보내면 텍스트 추출 능력
  3. 텍스트 번역/이미지 내 글자 번역 능력
  4. 날씨 정보/뉴스 제공 능력 - 구글 검색, 빙 검색이 더 편리한 것 같음
  5. 지식 정보 검색 제공
  6. .. 여러 가지

카톡 AskUp을 친구추가 하신 분들은 모두 위처럼 편리한 능력들을 사용하고 있을 테고, 저는 대체로 영어/한글 번역과 이미지 내 텍스트 추출 기능을 많이 사용합니다. 지금도 여전히 사용 중이고요.

그런데 말입니다.

AskUp 이 친구가 사진 또는 그림 해석도 기가 막히게 잘합니다. 마치 박물관이나 미술관 등에서 관람객에게 전시물이나 그림을 설명하며 이해를 돕는 "도슨트(Docent)"처럼 말이죠.

아래 이미지를 봅시다.

 

질문에 엉뚱한 대답하는 AskUp 이미지
엉뚱한 AskUp

 

이미지만 전달했을 땐 AskUp 얘가 이상하죠. 엉뚱한 소리 늘어놓는 거 보니 전송한 이미지는 파악을 못하는 것 같습니다. 그럼 해당 이미지 URL로 다시 질문해 보겠습니다.

 

이미지를 설명해주는 AskUp, 도슨트 아숙업

 

와우~ 엉뚱한 소리 하던 아숙업이 갑자기 미술관의 전문 도슨트 AI로 변신했습니다.

아마 첫 줄에 있는 "프리러브 페스티벌"이라는 문구는 이미지 URL에 포함되어 있는 말을 가지고 온 것 같고요. 나머지 설명들을 한 번 알아보겠습니다.

 

파이즐리 패턴, 싸이키델릭 분위기, 로이 리히텐스타인, 패트릭 나겔이 어떤 뜻이고 어떤 인물인지 알 수 없어서 구글 검색해 본 결과는 놀랍습니다.

 

파이즐리 패턴, 싸이키델릭 분위기, 로이 리히텐스타인, 패트릭 나겔의 구글 검색 결과

 

제 생각엔 꽤 정확한 해석에 가깝다고 보이는데 어떤가요.

참고로 위에 해석을 요청한 이미지는 그림 AI, 미드저니에서 만들어 낸 작품입니다.

 

미드저니에서 생성한 그림

 


 

그럼 AskUp의 영문 번역과 해석의 차이를 확인해 보겠습니다.

샘플이 될 영문은 역시 미드저니 프롬프트에 쓰인 내용으로 테스트했습니다.

테스트 문구:
Interior design of a minimalist container tiny house, Large Windows, Bed, Kitchen, Living Room, diffuse-back-light, award winning photography, realistic photography, hyper realistic, unreal engine, realistic lense flare, real lighting, inscriptions, hyper realistic, 8k, detailed, photography, Cinematic Lighting, Studio Lighting, Beautiful Lighting, Accent Lighting, Global Illumination, Screen Space Global Illumination, Ray Tracing Global Illumination, Optics, Scattering, Glowing, Shadows, Rough, Shimmering, Ray Tracing Reflections, Lumen Reflections, Diffraction Grading, GB Displacement, Scan Lines, Ray Traced, Ray Tracing Ambient Occlusion, Anti-Aliasing, FKAA, TXAA, RTX, SSAO, Shaders, OpenGL-Shaders, GLSL-Shaders, Post Processing, Post-Production, Cel Shading, Tone Mapping, CGI, VFX, SFX, insanely detailed and intricate, hypermaximalist, elegant, hyper realistic, super detailed

 

첫 대답은 영문 번역 결과, 두 번째 대답은 영문 해석 결과

 

놀라운 AskUp 영문 해석 결과

 

첫 번째 대답은 영문 각 단어, 단어 번역만 했을 뿐이지만, 두 번째 대답은 단어의 번역은 물론 해석까지 완벽하게 풀어주는 모습입니다.

어떤가요 놀랍지 않은가요. 저는 주로 미드저니나 그림 AI에 쓰일 프롬프트 분석을 위해 "AskUp의 분석 능력"을 사용 중이지만, 다른 쪽으로도 "그림 해석 능력"을 충분히 잘 활용할 수 있을 것으로 보입니다.

 

마지막으로 위 프롬프트로 생성된 미드저니 이미지를 소개하며 글을 마치겠습니다.

 

Midjourney 인테리어 디자인 하우스



반응형