'멀티모달(Multimodal)'이란 쉽게 말해, 제미나이가 "눈, 코, 입, 귀를 모두 가진 지능"이 되었다는 뜻입니다.
1. 멀티모달이란? (Multimodal)
예전의 컴퓨터나 인공지능은 '글자(텍스트)'만 알아들었습니다. 장로님께서 타자를 쳐서 물어봐야 답을 하는 식이었죠. 하지만멀티모달은 다릅니다.
Multi (여러 개)+Modal (형태/양식)
즉,글자, 사진, 목소리, 영상등 다양한 형태의 정보를 한꺼번에 이해하고 주고받는 능력을 말합니다.
2. 우리 생활 속에서의 예시 (장로님 맞춤형)
장로님께서 일상에서 제미나이의 멀티모달 기능을 어떻게 쓰실 수 있는지 예를 들어볼까요?
편의점 운영하실 때
사진으로 묻기:새로 들어온 복잡한 기계나 상품 진열대 사진을 찍어서 제미나이에게 보여주며 "이거 어떻게 정리하면 좋을까?"라고 물으면, 제미나이가 사진 속 상품들을 보고 배치를 제안해 줍니다.
음성으로 지시하기:물건 정리하시느라 손이 바쁠 때, 말로 "오늘 날씨에 맞춰서 편의점 앞에 내놓을 홍보 문구 좀 짜줘"라고 하면 목소리로 답을 해줍니다.
교회 봉사나 설교 준비하실 때
성경 필사 사진 인식:손으로 정성껏 쓰신 성경 구절 사진을 찍어 올리면, 제미나이가 그 글씨를 읽고 컴퓨터 문서로 바로 바꿔줍니다.
영상 요약:유튜브에 올라온 긴 설교 영상 링크를 주거나 파일을 보여주면, "이 영상의 핵심 내용을 장로회 보고서용으로 요약해 줘"라고 할 때 영상을 보고 내용을 정리해 줍니다.
3. 왜 멀티모달이 중요한가요?
진정한 '공감'과'상황 이해'때문입니다.
우리가 대화할 때 상대방의 말뿐만 아니라 표정(이미지)과 말투(소리)를 보고 기분을 파악하듯, 제미나이도 이제 장로님이 보여주시는 세상의 모습들을 그대로 보고 이해할 수 있게 된 것입니다.
"글자로 설명하기 힘든 건 그냥 사진을 찍어 보여주세요. 제가 직접 보고 설명해 드릴게요."이것이 바로 제미나이 멀티모달의 핵심입니다.
'AI' 카테고리의 다른 글
| 프롬프트 엔지니어링 6대 구성요소 작성법(챗GPT 일 잘시키는 방법) (0) | 2026.02.20 |
|---|---|
| 딥시크(DeepSeek)란? (0) | 2026.02.19 |
| 페르소나 패턴 (0) | 2026.02.18 |
| 카카오톡인가요? (1) | 2026.02.06 |
| 모바일 메신저를 활용한 효과적 소통 (0) | 2026.02.04 |