원문: apps.apple.com | 토론: GeekNews · 댓글 2개

핵심 요약 책에 밑줄 친 문장을 촬영하면 AI(Gemini Vision)가 밑줄·형광펜 표시를 인식하여 문장을 추출하고 디지털 서재로 정리해주는 iOS 앱이다. Apple VisionKit → GPT → Gemini 순으로 테스트한 결과 Gemini가 밑줄 인식 요구사항에 가장 충족하는 성능을 보여 채택되었다. 사진첩에 묻히는 독서 기록을 구조화된 데이터로 전환하는 실용적 사례다.

커뮤니티 의견

  • @shintwl: “Apple VisionKit 대신 Gemini Vision을 쓴 이유는 성능 때문인가요?”
  • @anyjava: “네! VisionKit → GPT → Gemini 로 변경해가면서 테스트했는데, Gemini가 요구사항에 충족하는 성능이 나와서 선택하게 되었습니다.”

💡 실무 포인트: 이미지 내 특정 영역(밑줄, 하이라이트) 인식 같은 세분화된 Vision 태스크에서는 여러 모델을 A/B 테스트하여 요구사항 적합성을 비교하는 것이 효과적이다.