
50개 문제와 45분 시간 제한으로 실제 시험을 시뮬레이션하세요. AI 검증 답안과 상세 해설로 학습하세요.
AI 기반
모든 답안은 3개의 최고 AI 모델로 교차 검증하여 최고의 정확도를 보장합니다. 선택지별 상세 해설과 심층 문제 분석을 제공합니다.
DRAG DROP - 머신 러닝 유형을 적절한 시나리오와 매칭하세요. 답하려면 왼쪽 열에서 적절한 머신 러닝 유형을 오른쪽의 해당 시나리오로 끌어다 놓으세요. 각 머신 러닝 유형은 한 번만 사용할 수도, 여러 번 사용할 수도, 또는 전혀 사용하지 않을 수도 있습니다. 참고: 각 정답 선택은 1점입니다. 선택 및 배치:
공항의 적설량을 기반으로 항공편이 몇 분 늦게 도착할지 예측한다. ______
“몇 분 늦는지”를 예측하는 것은 연속적인 숫자 값(분)을 예측하는 것입니다. 이는 regression 문제의 결정적 특징입니다. 즉, 모델이 입력 특징(예: 적설량, 공항, 계절, 과거 지연 패턴)과 숫자형 타깃 간의 관계를 학습합니다. 왜 classification이 아닌가? 출력이 “정시 / 지연” 또는 “0–15분, 16–30분, 31분 이상 지연”과 같은 범주라면 classification이 적용됩니다. 이는 연속적인 숫자가 아니라 이산적인 class입니다. 왜 clustering이 아닌가? clustering은 라벨이 있는 타깃 없이 그룹을 발견하는 데 사용됩니다. 여기서는 타깃 변수(지연 분)가 명확히 존재하고 이를 직접 예측하려는 것이므로 supervised regression이 적절합니다.
마케팅 부서를 지원하기 위해 고객을 서로 다른 그룹으로 세분화합니다. ______
마케팅을 위한 고객 세분화는 전형적인 클러스터링 시나리오입니다. 일반적으로 고객의 속성과 행동(구매 빈도, 평균 주문 금액, 제품 카테고리, 웹사이트 활동, 인구통계) 데이터는 있지만, “Segment A, Segment B”와 같은 레이블은 이미 존재하지 않습니다. 클러스터링 알고리즘은 같은 클러스터 내의 고객들이 다른 클러스터의 고객들보다 서로 더 유사하도록 고객을 그룹화합니다. 왜 분류가 아닌가? 분류는 과거 데이터에 미리 정의된 세그먼트 레이블이 필요합니다(예: 각 고객의 세그먼트를 이미 알고 있고, 신규 고객에 대해 이를 예측하려는 경우). 여기서는 그런 전제가 암시되지 않습니다. 왜 회귀가 아닌가? 회귀는 숫자 값(예: lifetime value)을 예측합니다. 세분화는 그룹화에 관한 것이지, 연속적인 숫자를 예측하는 것이 아닙니다.
학생이 대학교 과정을 완료할지 여부를 예측하시오. ______
학생이 과정을 완료할지 여부를 예측하는 것은 예/아니오 결과이므로, 이진 분류 문제입니다. 모델은 출석, 과제 제출, 성적, 참여도 지표, 이전 수강 이력과 같은 특징을 사용하여 두 개의 이산 클래스(“완료” 또는 “미완료”) 중 하나를 예측합니다. 왜 회귀가 아닌가? 회귀는 “최종 성적 백분율” 또는 “완료까지 남은 주 수”처럼 연속적인 값을 예측할 때 사용됩니다. 예/아니오를 1/0으로 인코딩하더라도, 원하는 출력이 범주이기 때문에 근본적인 과제는 여전히 분류입니다. 왜 클러스터링이 아닌가? 클러스터링은 행동 패턴에 따라 학생들을 그룹화할 수는 있지만, 추가적인 해석 없이 완료 여부라는 라벨이 있는 질문에 직접 답하지는 못합니다.
이동 중에도 모든 문제를 풀고 싶으신가요?
Cloud Pass를 무료로 다운로드하세요 — 모의고사, 학습 진도 추적 등을 제공합니다.


이동 중에도 모든 문제를 풀고 싶으신가요?
무료 앱 받기
Cloud Pass를 무료로 다운로드하세요 — 모의고사, 학습 진도 추적 등을 제공합니다.
HOTSPOT - 문장을 완성하려면 답변 영역에서 적절한 옵션을 선택하세요. 핫 영역:
모델의 예측에 영향을 미치는 데이터 값은 ______라고 합니다.
정답: B. features. Features는 모델이 패턴을 학습하고 예측을 수행하기 위해 사용하는 입력 데이터 값(열)입니다. 예를 들어, 주택 가격 모델에서 면적, 침실 수, 위치는 예측된 가격에 영향을 미치므로 features입니다. 다른 선택지가 틀린 이유: - A. 종속 변수: 대부분의 ML 용어에서 종속 변수는 예측하려는 목표/출력(종종 label과 동의어)을 의미하며, 예측에 영향을 주는 입력이 아닙니다. - C. 식별자: 식별자(예: CustomerID)는 레코드를 고유하게 식별하지만, 일반화 가능한 패턴을 나타내지 않기 때문에 보통 예측 입력으로 사용하지 않아야 합니다. 또한 데이터 누수(data leakage)를 유발할 수 있습니다. - D. labels: Label은 지도 학습에서 학습에 사용되는 알려진 결과/목표 값(예: “price” 또는 “spam/not spam”)이며, 예측에 영향을 미치는 입력 값이 아닙니다.
HOTSPOT - 다음 각 문장에 대해 문장이 참이면 Yes를 선택합니다. 그렇지 않으면 No를 선택합니다. 참고: 각 정답 선택은 1점입니다. 핫 영역:
과거 데이터를 기반으로 주택 가격을 예측하는 것은 이상 탐지의 예이다.
과거 데이터를 기반으로 주택 가격을 예측하는 것은 이상 탐지가 아니다. 핵심 문구는 “과거 데이터를 기반으로 … 예측”이며, 이는 시계열 예측(time-series forecasting) 문제를 의미한다. 즉, 과거 값(그리고 금리, 재고, 계절성 같은 외부 변수도 가능)을 사용해 미래 가격을 예측한다. 목표는 드문 일탈을 식별하는 것이 아니라, 기대되는 미래 값을 추정하는 것이다. 반면 이상 탐지(anomaly detection)는 정상 패턴에서 벗어나는 비정상적인 주택 가격이나 거래를 찾는 데 초점을 둔다(예: 유사 매물 대비 지나치게 높은 매매가로, 데이터 오류나 사기 가능성을 시사). AI-900에서 예측과 이상 탐지는 서로 다른 워크로드 유형이다. 예측은 무엇이 일어날지를 예측하고, 이상 탐지는 정상 동작 대비 무엇이 비정상인지 표시한다. 따라서 정답은 아니오이다.
일반적인 패턴에서 벗어나는 편차를 찾아 의심스러운 sign-in을 식별하는 것은 anomaly detection의 예입니다.
일반적인 패턴에서 벗어나는 편차를 찾아 의심스러운 sign-in을 식별하는 것은 전형적인 anomaly detection 시나리오입니다. 목표는 정상적인 사용자 행동의 baseline에 비추어, 드물거나 비정상적인 이벤트—예: 비정형적인 위치에서의 login, impossible travel(짧은 시간 내에 멀리 떨어진 두 곳에서 sign-in), 비정상적인 device fingerprint, 비정상적인 login 시간, failed attempt의 급증—를 탐지하는 것입니다. 이는 anomaly detection의 정의(대다수와 유의미하게 다른 관측치를 찾는 것)와 직접적으로 일치합니다. anomaly는 계정 탈취나 악성 활동을 나타낼 수 있기 때문에 cybersecurity 및 fraud detection에서 자주 사용됩니다. 이는 주로 forecasting(미래의 수치 값을 예측)이나, 이미 “suspicious” 대 “normal”로 라벨링된 예시가 있는 경우가 아니라면 표준 classification에 해당하지 않습니다. classification을 사용하더라도, 프롬프트의 핵심 개념인 “일반적인 패턴에서의 편차”는 anomaly detection에 해당합니다. 따라서 정답은 예입니다.
환자의 병력을 기반으로 환자가 당뇨병이 발병할지 여부를 예측하는 것은 anomaly detection의 예입니다.
환자의 병력을 기반으로 환자가 당뇨병이 발병할지 여부를 예측하는 것은 anomaly detection이 아니라 classification입니다. 출력은 이산적인 레이블(예: “당뇨병 발병: 예/아니요”)이며, 모델은 결과가 알려진 과거 환자 기록으로 학습됩니다. 이는 supervised learning 작업입니다. anomaly detection은 목표가 비정상적인 환자 측정값이나 정상 집단에서 벗어나는 드문 패턴을 식별하는 것이라면 더 적절합니다(예: 진단되지 않은 상태를 시사할 수 있는 비정상적인 검사 결과를 탐지). 하지만 문제는 특정 결과(당뇨병 발병)를 예측하는 것에 대해 명시적으로 묻고 있으며, 이는 전형적인 binary classification 사용 사례입니다. AI-900에서 기억할 점: classification은 범주를 예측하고, regression은 숫자를 예측하며, forecasting은 시간 기반의 미래 값을 예측하고, anomaly detection은 드문 일탈을 표시합니다. 이 시나리오는 결과 예측(예/아니요)이므로 정답은 아니요입니다.
DRAG DROP - 책임 있는 AI를 위한 Microsoft의 지침 원칙을 해당 설명과 일치시키세요. 답하려면 왼쪽 열에서 적절한 원칙을 오른쪽의 설명으로 끌어다 놓으세요. 각 원칙은 한 번만, 여러 번, 또는 전혀 사용하지 않을 수 있습니다. 참고: 각 정답 선택은 1점입니다. 선택 및 배치:
AI 시스템이 원래 설계된 대로 작동하고, 예상치 못한 조건에 대응하며, 유해한 조작에 저항하도록 보장합니다.
정답: E (Reliability and safety). 이 설명은 AI 시스템이 의도된 설계와 일관되게 동작하고, 예기치 않은 조건을 처리하며, 유해한 조작에 저항해야 함을 강조합니다. 이는 전형적인 reliability/safety 우려 사항입니다: robustness, fault tolerance, adversarial inputs에 대한 resilience, 그리고 edge cases에서의 안전한 운영. 다른 선택지가 틀린 이유: - A (Accountability)는 누가 책임을 지는지와 oversight 및 governance를 보장하는 것에 관한 것이며, 모델의 기술적/운영적 robustness에 관한 것이 아닙니다. - B (Fairness)는 집단 간 차별적 결과를 피하는 데 초점을 둡니다. - C (Inclusiveness)는 접근성과 다양한 능력 및 요구를 가진 사람들에게 솔루션이 작동하도록 보장하는 데 초점을 둡니다. - D (Privacy and security)는 데이터를 보호하고 데이터 사용을 통제하는 데 초점을 두며, 주로 모델의 robustness와 안전한 동작에 관한 것은 아닙니다.
AI 시스템이 내린 결정이 인간에 의해 재정의될 수 있도록 보장하는 프로세스를 구현하는 것.
정답: A (Accountability). 핵심 문구는 AI 결정이 “인간에 의해 재정의될 수 있다”는 점입니다. 이는 human-in-the-loop governance로, 적절한 감독, escalation path, 그리고 자동화된 결정이 부정확하거나 부적절할 때 사람이 개입할 수 있는 능력을 보장하는 것을 의미합니다. Accountability는 또한 결과에 대한 명확한 책임 소재와 auditing 및 remediation을 위한 프로세스를 포함합니다. 다른 선택지가 틀린 이유: - E (Reliability and safety)는 시스템이 안전하고 견고하게 동작하는 것에 관한 것이지만, 인간이 재정의할 수 있어야 한다는 명시적 요구사항은 accountability 및 governance에 더 직접적으로 해당합니다. - D (Privacy and security)는 데이터 보호와 consent에 관한 것이지, 결정 재정의에 관한 것이 아닙니다. - B (Fairness)는 bias와 공정한 결과에 관한 것입니다. - C (Inclusiveness)는 접근성과 다양한 사용자를 고려한 설계에 관한 것입니다.
소비자에게 자신의 데이터 수집, 사용, 저장에 대한 정보와 통제권을 제공한다.
정답: D (프라이버시 및 보안). 이 설명은 소비자에게 자신의 데이터가 어떻게 수집, 사용, 저장되는지에 대한 정보와 통제권을 제공하는 것에 명시적으로 초점을 둡니다. 이는 프라이버시 원칙(투명성, 동의, 데이터 최소화, 적절한 보존)과 보안 원칙(저장/전송 중 데이터 보호, 접근 제어)에 직접적으로 부합합니다. 다른 선택지가 틀린 이유: - A (책임성)는 AI 결과에 대한 감독과 책임에 관한 것이지, 개인 데이터에 대한 사용자 통제권에 관한 것이 아닙니다. - E (신뢰성 및 안전)는 견고하고 안전한 시스템 동작에 관한 것입니다. - B (공정성)는 편향된 결과를 피하는 것에 관한 것입니다. - C (포용성)는 다양한 요구를 가진 사람들이 사용할 수 있고 혜택을 받을 수 있도록 솔루션을 보장하는 것에 관한 것이지, 데이터 거버넌스에 관한 것이 아닙니다.
직원들이 출장 중에 경비를 스캔하고 저장할 수 있는 모바일 앱을 개발해야 합니다. 어떤 유형의 computer vision을 사용해야 합니까?
Semantic segmentation은 각 픽셀에 클래스 라벨을 할당합니다(예: 자율주행에서 도로, 하늘, 자동차를 분리). 정밀한 객체 경계와 픽셀 수준의 이해가 필요할 때 유용합니다. 경비 영수증의 경우 픽셀 수준 라벨링은 불필요하며, 목표는 텍스트와 key-value 필드를 추출하는 것이므로 OCR 및 문서 분석 서비스가 더 적합합니다.
Image classification은 전체 이미지에 대해 단일 라벨(또는 라벨 집합)을 예측합니다(예: “receipt,” “menu,” “passport”). 분류는 이미지 라우팅(예: 사진이 영수증인지 감지)에 도움이 될 수 있지만, 가맹점명, 날짜 또는 합계를 추출하지는 못합니다. 영수증 내용을 읽고 경비 세부 정보를 저장하려면 여전히 OCR이 필요합니다.
Object detection은 bounding box를 사용해 객체를 식별하고 위치를 찾습니다(예: 사진에서 노트북과 휴대폰 감지). 더 큰 장면 내에서 영수증의 존재와 위치를 감지하여 크롭을 가능하게 할 수는 있습니다. 그러나 object detection은 인쇄된 텍스트를 기계가 읽을 수 있는 텍스트로 변환하지 못하므로, OCR 없이 경비 금액이나 판매자명을 캡처할 수 없습니다.
Optical character recognition (OCR)은 앱이 스캔된 비용 영수증에서 텍스트를 읽어야 하므로 올바른 선택입니다. OCR은 이미지 속 인쇄된 텍스트 또는 손글씨 텍스트를 machine-readable text로 변환하며, 이후 이를 비용 시스템에 저장할 수 있습니다. 이는 영수증이 주로 가맹점 이름, 날짜, 총액과 같은 텍스트 정보를 포함한다는 점에서 시나리오와 정확히 일치합니다. Azure AI-900 관점에서 요구 사항이 이미지에서 텍스트를 추출하는 것이라면, OCR이 기대되는 computer vision 기능입니다.
핵심 개념: 이 문제는 이미지에서 텍스트를 추출하는 올바른 computer vision 워크로드인 Optical Character Recognition (OCR)을 식별할 수 있는지를 평가합니다. Azure AI에서 OCR은 일반적으로 Azure AI Vision (Image Analysis/Read)을 통해 제공되며, 이미지와 문서에서 인쇄된 텍스트 또는 손글씨 텍스트를 감지하고 추출하는 데 사용됩니다. 정답인 이유: 직원들이 출장 중 영수증을 스캔할 때, 앱은 영수증 이미지를 캡처한 다음 핵심 비용 세부 정보(가맹점 이름, 날짜, 품목, 총액, 통화, 세금)를 추출해야 합니다. 여기서 핵심 기능은 영수증 이미지의 텍스트를 machine-readable text로 변환하여 저장, 검색, 검증하고 비용 보고 워크플로에 활용할 수 있게 하는 것입니다. OCR은 바로 이 목적에 맞게 설계되었습니다. OCR은 텍스트 영역을 찾고, 구조화된 형태(줄/단어)와 confidence score와 함께 인식된 텍스트를 반환합니다. 주요 기능 / 모범 사례: Azure의 OCR(종종 Azure AI Vision의 “Read” 기능이라고 함)은 인쇄된 텍스트와 손글씨 텍스트를 지원하고, 여러 언어를 처리하며, bounding box와 confidence value를 반환합니다. 영수증의 경우 일반적으로 OCR과 후처리를 함께 사용합니다. 예를 들어 규칙 또는 추가 AI model을 사용해 총액/날짜를 파싱하고, confidence threshold를 검증하며, 이미지 품질 문제(흐림, 기울어짐, 조명 불량)를 처리합니다. 솔루션 관점에서는 이미지를 Azure Blob Storage에 저장하고, 추출된 텍스트/metadata를 데이터베이스(예: Azure SQL 또는 Cosmos DB)에 저장합니다. 개인정보 보호 및 규정 준수(영수증의 PII)를 고려하고, managed identity와 encryption을 사용해 액세스를 보호해야 합니다. 흔한 오해: Object detection은 이미지에서 영수증을 찾을 수는 있지만, 텍스트를 읽지는 못합니다. Image classification은 이미지를 “receipt” 또는 “not receipt”로 분류할 수는 있지만, 역시 비용 값을 추출하지는 못합니다. Face detection은 신원 확인을 하는 경우가 아니라면 관련이 없습니다. 시험 팁: AI-900에서는 작업을 워크로드에 매핑하세요: “이미지/문서에서 텍스트 읽기” => OCR (Azure AI Vision Read). “항목과 그 위치 찾기” => object detection. “이미지에 레이블 지정” => image classification. “사람/얼굴 감지” => face detection. 시나리오에서 양식, 송장, 영수증 스캔 또는 텍스트 추출이 언급되면 OCR이 거의 항상 올바른 선택입니다.
기존 dataset에서 training dataset과 validation dataset을 생성해야 합니다. Azure Machine Learning designer에서 어떤 module을 사용해야 하나요?
Select Columns in Dataset은 dataset에서 특정 column(feature)을 포함하거나 제외하는 데 사용됩니다. feature selection, ID/label/불필요한 field 제거, 학습 전 schema 구성에 도움이 됩니다. 하지만 row를 training과 validation dataset으로 분할하지는 않으므로, 하나의 dataset에서 train/validation split을 만들 수 없습니다.
Add Rows는 한 dataset을 다른 dataset에 row를 쌓아 추가하는 방식(union/concatenation 작업)으로 append합니다. 동일한 schema를 가진 dataset을 합쳐 record 수를 늘릴 때(예: 월별 파일 결합) 유용합니다. dataset을 training과 validation subset으로 분할하지 않으며, 대신 dataset을 결합합니다.
Split Data는 기존 dataset에서 training dataset과 validation(또는 test) dataset을 생성하기 위한 올바른 module입니다. 지정된 비율에 따라 row를 두 개의 output으로 분할하며, 대표 샘플링을 위해 split을 무작위화할 수도 있습니다. 이는 Azure ML designer pipeline에서 한 subset으로 학습하고 다른 subset으로 평가하기 위한 표준 단계입니다.
Join Data는 key column을 기준으로 두 dataset을 나란히 병합하는 방식(SQL join과 유사)입니다. 다른 table에서 추가 feature를 가져와 데이터를 보강하는 데 사용됩니다. 데이터 준비에 중요하지만, 단일 dataset에서 별도의 training 및 validation dataset을 생성하지는 않으며, 분할이 아니라 결합을 수행합니다.
핵심 개념: 이 문제는 하나의 기존 dataset에서 별도의 training 및 validation(또는 test) dataset을 만들어 machine learning용 데이터를 준비하는 방법을 평가합니다. Azure Machine Learning designer에서 이는 model이 보지 못한 데이터에 얼마나 잘 일반화되는지 평가하는 데 사용되는 표준 전처리 단계입니다. 정답인 이유: Split Data module은 하나의 dataset을 두 개의 output으로 나누도록 특별히 설계되었습니다. 이러한 output은 일반적으로 training set과 validation 또는 test set으로 사용됩니다. 이 module은 비율 기반 분할을 지원하며, 각 subset이 원래 dataset을 더 잘 대표하도록 row를 무작위화할 수 있습니다. 주요 기능: Split Data를 사용하면 70/30 또는 80/20과 같이 각 output으로 보낼 데이터의 양을 제어할 수 있습니다. 또한 무작위 분할을 사용할 수 있고, 일관된 구성을 통해 재현 가능한 결과를 지원할 수 있습니다. 일반적인 Azure ML designer workflow에서는 한 output을 사용해 model을 학습시키고, 다른 output을 사용해 이를 score하고 evaluate합니다. 일반적인 오해: 일부 학습자는 column 선택과 data 분할을 혼동하지만, Select Columns in Dataset은 포함할 field만 변경할 뿐 row의 별도 subset을 만들지는 않습니다. Add Rows와 Join Data는 둘 다 dataset을 결합하는 데 사용되며, 하나의 dataset을 training 및 validation 부분으로 나누는 데 사용되지 않습니다. 시험 팁: AI-900에서는 하나의 dataset에서 training 및 validation 또는 test dataset을 만드는 것에 대해 묻는 문제가 나오면 정답 module은 Split Data라는 점을 기억하세요. 문제가 feature 선택에 관한 것이라면 Select Columns in Dataset을 떠올리세요. dataset 결합에 관한 것이라면 Add Rows 또는 Join Data를 떠올리세요.
청각, 시각 및 기타 장애가 있는 사람을 포함하여 모든 사람이 역량을 발휘할 수 있도록 지원하는 AI 시스템을 설계하고 있습니다. 이는 책임 있는 AI를 위한 Microsoft의 어떤 가이드 원칙의 예시입니까?
Fairness는 AI 시스템이 사람들을 공정하게 대우하고 편향을 만들거나 강화하지 않도록 보장하는 것입니다. 이는 그룹 간 결과(예: 인구통계 전반에서 유사한 error rates 또는 의사결정 영향)에 초점을 둡니다. fairness가 소외된 그룹을 고려하는 것을 포함할 수는 있지만, 이 시나리오는 장애가 있는 사람을 위한 접근성에 명시적으로 초점을 두고 있어 포용성 원칙이 더 직접적입니다.
Inclusiveness는 장애가 있는 사람을 포함하여 모든 사람이 역량을 발휘하고 참여할 수 있도록 AI가 지원해야 한다는 원칙입니다. 이는 접근성과 다양한 능력을 수용하는 AI 경험 설계(예: 청각 장애를 위한 captions, 시각 장애를 위한 screen-reader-friendly outputs, 대체 상호작용 방식)를 강조합니다. 시나리오의 표현은 포용성과 거의 그대로 일치합니다.
Reliability and safety는 AI 시스템이 예상 및 예상치 못한 조건에서 일관되게 동작하는지, 그리고 실패로 인해 피해를 유발하지 않는지에 초점을 둡니다. 예로는 edge cases에 대한 견고성, 모니터링, fallback behaviors, 안전한 배포 관행 등이 있습니다. 이 시나리오는 시스템 안정성이나 안전 제어가 아니라 접근성과 폭넓은 사용성에 관한 것입니다.
Accountability는 AI 시스템에 대한 적절한 거버넌스, 감독, 책임을 갖추는 것입니다. 여기에는 인간의 감독, auditability, 의사결정과 영향에 대한 명확한 소유권이 포함됩니다. accountability는 어떤 AI 솔루션에도 중요하지만, 이 시나리오는 장애가 있는 사람이 시스템을 사용할 수 있도록 하는 데 초점을 두고 있으므로 거버넌스보다는 포용성과 정렬됩니다.
핵심 개념: 이 문제는 Microsoft의 Responsible AI 가이드 원칙을 평가합니다. 이러한 원칙은 AI 시스템이 사람과 사회에 이익이 되도록 어떻게 설계되고 운영되어야 하는지를 설명합니다. AI-900에서는 짧은 시나리오를 통해 각 원칙의 의도를 식별할 수 있어야 합니다. 정답이 맞는 이유: “청각, 시각 및 기타 장애가 있는 사람을 포함하여 모든 사람이 역량을 발휘할 수 있도록 지원”하는 AI 시스템을 설계하는 것은 포용성 원칙에 직접적으로 해당합니다. 포용성은 장애가 있는 사람을 포함해 다양한 능력, 배경, 요구를 가진 사람들이 AI 시스템에 접근하고 사용할 수 있도록 보장하는 것입니다. 이는 장벽을 제거하는 경험(예: screen reader 지원, captions, 대체 입력 방식, assistive technologies)을 설계하여 AI의 혜택이 폭넓게 공유되도록 하는 데 중점을 둡니다. 주요 특징 / 모범 사례: AI에서 포용성은 종종 다음을 포함합니다: - Accessibility-by-design: 시각/청각/이동 장애가 있는 사용자를 위해 인터페이스와 출력이 작동하도록 보장(captions, transcripts, high-contrast UI, keyboard navigation). - Multimodal experiences: 텍스트, 오디오, 시각적 대안을 제공(예: speech-to-text 및 text-to-speech). - Inclusive data and testing: 다양한 사용자 그룹과 assistive technology 시나리오로 시스템을 검증. 포용적 테스트와 모니터링을 포함하면 Azure Well-Architected Framework의 Reliability 및 Operational Excellence 같은 원칙과도 정렬될 수 있지만, 이 문제에서 평가하는 가이드 원칙은 구체적으로 Responsible AI의 “Inclusiveness”입니다. 흔한 오해: - Fairness도 특정 그룹에 대한 피해를 피하는 것과 관련이 있어 비슷하게 들릴 수 있지만, fairness는 모델 의사결정에서의 편향/차별을 피하고 공정한 결과를 내는 데 초점을 둡니다. - Reliability and safety는 접근성이 아니라 견고성, failure modes, 안전한 운영에 초점을 둡니다. - Accountability는 거버넌스, human oversight, 결과에 대한 책임에 관한 것입니다. 시험 팁: AI-900에서는 다음 키워드를 확인하세요: - “Accessible,” “people with disabilities,” “empower everyone,” “assistive” → Inclusiveness. - “Bias,” “equal treatment,” “disparate impact” → Fairness. - “Robust,” “safe,” “resilient,” “fails gracefully” → Reliability and safety. - “Human in the loop,” “audit,” “governance,” “responsible party” → Accountability.
DRAG DROP - machine learning 작업을 적절한 시나리오에 매칭하세요. 답하려면 왼쪽 열에서 적절한 작업을 오른쪽의 해당 시나리오로 드래그하세요. 각 작업은 한 번만, 여러 번, 또는 전혀 사용하지 않을 수 있습니다. 참고: 각 정답 선택은 1점입니다. 선택 및 배치:
______ 혼동 행렬(confusion matrix)의 값들을 검토하는 것
혼동 행렬(confusion matrix)의 값들을 검토하는 것은 model evaluation의 일부입니다. 혼동 행렬은 validation/test 데이터에서의 분류 결과(true positives, false positives, true negatives, false negatives)를 요약하여, 성능을 평가하고 precision 및 recall 같은 metric을 계산하는 데 도움이 됩니다. 왜 다른 선택지는 아닌가: - Feature engineering (A)은 입력을 변경/생성하는 것이며, 예측을 평가하는 것이 아닙니다. - Feature selection (B)은 어떤 입력을 유지할지 선택하는 것입니다. - Model training (E)은 학습/피팅 단계이며, 혼동 행렬은 일반적으로 학습 후 데이터셋을 scoring할 때 생성됩니다. - Model deployment (C)은 실제 사용을 위해 모델을 패키징하고 호스팅하는 것(endpoint, container 등)이지, metric을 분석하는 것이 아닙니다.
______ 날짜를 월, 일, 연도 필드로 분할하기
날짜를 월, 일, 연도 필드로 분할하는 것은 feature engineering입니다. 이는 원시 속성을 여러 파생 feature로 변환하여 패턴을 더 잘 포착할 수 있게 하기 때문입니다. 많은 모델은 단일 날짜 문자열/timestamp로부터 유용한 관계를 직접 학습하기 어렵지만, 해당 구성 요소를 명시적으로 제공하면 계절성(월), 월의 일(day-of-month) 효과, 또는 연도 추세를 학습할 수 있습니다. 다른 선택지가 아닌 이유: - Feature selection (B)은 날짜(또는 파생 필드)를 사용할지 여부를 선택하는 것이지, 분할을 수행하는 것이 아닙니다. - Model training (E)은 feature 준비가 끝난 후 알고리즘을 학습(fit)하는 단계입니다. - Model evaluation (D)은 성능을 측정하는 단계입니다. - Model deployment (C)은 학습된 모델을 운영 환경에 적용하는 단계입니다.
______ 날씨 모델을 학습시키기 위해 온도와 기압을 선택하기
날씨 모델을 학습시키기 위해 온도와 기압을 선택하는 것은 feature selection입니다. 모델에 입력으로 포함할 후보 변수(특징, features) 중 어떤 것을 포함할지 결정하는 것입니다. 좋은 feature selection은 관련 없거나 중복된 입력을 제거하여 과적합을 줄이고, 일반화 성능을 개선하며, 학습 비용을 낮출 수 있습니다. 다른 선택지가 아닌 이유: - Feature engineering (A)은 온도/기압을 변환하는 것(예: 값 정규화, 이동 평균 생성, 시간에 따른 기압 변화량 계산)입니다. - Model training (E)은 선택된 features로부터 알고리즘이 학습하는 단계입니다. - Model evaluation (D)은 학습 후 성능을 검증하기 위해 수행합니다. - Model deployment (C)은 추론을 위해 모델을 게시하는 것(예: Azure ML endpoint)입니다.
Azure에서 자연어 처리 솔루션을 개발하고 있습니다. 이 솔루션은 고객 리뷰를 분석하고 각 리뷰가 얼마나 긍정적인지 또는 부정적인지를 결정합니다. 이는 어떤 유형의 자연어 처리 워크로드의 예시입니까?
Language detection은 입력 텍스트의 언어(예: English vs. French)를 식별하며, 종종 confidence score와 함께 language code를 반환합니다. 다국어 리뷰가 있을 때 전처리 단계로 유용하지만, 리뷰가 긍정적인지 부정적인지는 판단하지 않습니다. 따라서 sentiment를 측정해야 한다는 요구사항과 일치하지 않습니다.
Sentiment analysis는 텍스트의 감정적 톤을 평가하여 positive, negative, neutral, 또는 mixed인지 판단하는 NLP 작업입니다. 고객 리뷰의 경우 전체 sentiment 레이블과 confidence score를 제공할 수 있으며, 때로는 문장 수준 sentiment를 통해 리뷰의 어떤 부분이 평가에 영향을 주는지 짚어낼 수도 있습니다. 이는 제시된 시나리오와 직접적으로 일치합니다.
Key phrase extraction은 텍스트에서 가장 중요한 단어나 구(예: “battery life,” “customer service,” “delivery time”)를 추출합니다. 고객이 어떤 주제를 언급하는지 요약하는 데 도움이 되지만, 해당 주제가 긍정적으로 언급되는지 부정적으로 언급되는지는 평가하지 않습니다. Sentiment analysis와 함께 사용되기도 하지만, 동일한 워크로드는 아닙니다.
Entity recognition(named entity recognition)은 사람, 조직, 위치, 날짜, 제품명과 같은 엔터티를 식별하고 분류합니다. 무엇이 논의되고 있는지(예: “Contoso,” “Seattle”)를 이해하는 데 유용하지만, 의견의 극성(polarity)을 측정하지는 않습니다. 따라서 긍정/부정을 판단해야 한다는 요구사항을 충족하지 않습니다.
핵심 개념: 이 문제는 Azure에서의 일반적인 Natural Language Processing (NLP) 워크로드를 식별하는 능력을 평가하며, 특히 텍스트가 긍정적/부정적/중립적/혼합된 의견을 표현하는지 판단하는 기능을 묻습니다. Azure AI services에서는 이 기능이 Sentiment Analysis(Azure AI Language의 일부, 이전 명칭 Text Analytics)로 제공됩니다. 정답이 맞는 이유: 솔루션은 고객 리뷰를 분석하고 각 리뷰가 “얼마나 긍정적인지 또는 부정적인지”를 결정합니다. 이는 sentiment analysis의 정의 그대로이며, 텍스트의 감정적 톤/의견을 분류하고 점수화하는 작업입니다. Azure AI Language에서 sentiment analysis는 일반적으로 문서 전체의 sentiment 레이블(positive/neutral/negative/mixed)과 confidence score를 반환하며, 더 세밀한 인사이트를 위해 문장 수준 sentiment도 제공할 수 있습니다. 주요 기능 / 활용 방식: Sentiment analysis는 고객 피드백, 소셜 미디어 모니터링, 지원 티켓 등에 흔히 적용되어 만족도를 측정하고 문제를 조기에 감지합니다. Azure AI Language에서는 텍스트(단일 또는 배치)를 제출하고 언어를 선택(또는 language detection과 결합)하면 sentiment 레이블과 점수를 받습니다. 모범 사례로는 노이즈가 많은 텍스트 정제, sarcasm/irony 한계 처리, 도메인 특화 데이터에서의 결과 평가가 있습니다. Azure Well-Architected Framework 관점에서는 reliability(재시도 정책, 지역 배포), security(민감 데이터 전송 회피; 가능 시 private endpoints 사용), cost optimization(배치 요청, 처리량 적정화)을 고려하세요. 흔한 오해: Language detection은 엔드투엔드 파이프라인에 포함될 수 있지만, 언어(예: English, Spanish)만 식별하며 긍정/부정을 측정하지는 않습니다. Key phrase extraction은 중요한 용어를 찾는 것이지 sentiment가 아닙니다. Entity recognition은 사람/장소/조직 이름 등을 식별하는 것이지 의견을 판단하지 않습니다. 시험 팁: AI-900에서는 문구를 워크로드에 매핑하세요: - “positive/negative opinion” => sentiment analysis - “what language is this?” => language detection - “main talking points” => key phrase extraction - “people/places/brands” => entity recognition 또한, 이러한 기능은 대부분 fundamentals 수준 문제에서 custom model training이 아니라 Azure AI Language의 사전 구축된 NLP 기능이라는 점을 기억하세요.
간단한 사용자 질의에 답변하는 데 도움이 되는 비즈니스 챗봇을 위한 콘텐츠를 제공해야 합니다. QnA Maker를 사용하여 질문 및 답변 텍스트를 만드는 세 가지 방법은 무엇입니까? 각 정답은 완전한 솔루션을 제시합니다. 참고: 각 정답 선택은 1점입니다.
정답입니다. QnA Maker는 기존 웹페이지(일반적으로 FAQ 페이지)를 수집하여 Q&A 쌍을 생성할 수 있습니다. URL을 제공하면 서비스가 질문/답변 콘텐츠 또는 구조화된 섹션을 추출하여 knowledge base 항목을 구성합니다. 이는 기존 문서에서 챗봇 knowledge base를 빠르게 부트스트랩하는 주요하며 시험에 자주 나오는 방법입니다.
오답입니다. Automated machine learning (AutoML)은 Azure Machine Learning에서 ML 모델(분류, 회귀, 예측)을 학습시키는 데 사용되며, QnA Maker knowledge base를 만드는 데 사용되지 않습니다. QnA Maker는 Q&A 쌍을 authoring하고 내장된 ranking/matching을 사용하는 데 초점을 두며, Q&A 콘텐츠를 만들기 위해 질문 파일에 대해 AutoML을 실행할 필요가 없습니다.
정답입니다. QnA Maker 포털(또는 API)을 통해 질문과 답변을 수동으로 입력할 수 있습니다. 수동 authoring은 고품질 응답을 선별하고, 대체 질문(패러프레이즈)을 추가하며, 답변을 다듬는 데 중요합니다. 적절한 소스 문서나 웹페이지가 없을 때 knowledge base를 생성하거나 보완하는 간단한 방법입니다.
오답입니다. 봇을 채널(Cortana, Teams, Web Chat 등)에 연결하는 것은 Azure Bot Service 및 Bot Framework 채널을 통해 수행되는 배포/통합 단계입니다. 이는 QnA Maker에서 Q&A 쌍을 생성하지 않습니다. 채널을 통해 질문하는 것은 publish 이후 사용자가 봇과 상호작용하는 방식이지, knowledge base 콘텐츠를 authoring하는 방법이 아닙니다.
정답입니다. QnA Maker는 미리 정의된 데이터셋에서 chit-chat 콘텐츠를 가져오는 것을 지원합니다. 이를 통해 비즈니스 FAQ를 넘어 사용자 경험을 개선하는 일반적인 대화형 Q&A(인사, 예의 표현, 잡담)를 추가할 수 있습니다. 이는 QnA Maker authoring 내의 명시적인 콘텐츠 생성 방법이며 AI-900에서 자주 출제됩니다.
핵심 개념: 이 문제는 QnA Maker(FAQ 스타일의 질문 답변을 챗봇에 구축하기 위한 Azure Cognitive Services의 일부)에서 knowledge base를 채우는 방법에 대한 지식을 평가합니다. AI-900 관점에서 이는 Natural Language Processing (NLP)에 해당하며, 봇이 사용자 질의에 응답하는 데 사용할 수 있는 질문-답변 쌍을 만드는 것입니다. 정답이 맞는 이유: QnA Maker는 Q&A 쌍을 만들기 위한 여러 authoring 방법을 지원합니다. (1) 웹페이지 같은 기존 소스에서 Q&A 콘텐츠를 추출할 수 있고, (2) 포털에서 직접 Q&A 쌍을 수동으로 작성할 수 있으며, (3) “chit-chat” 데이터셋(미리 만들어진 대화형 Q&A)을 추가하여 인사말과 잡담에 자연스럽게 응답하도록 할 수 있습니다. 이는 A, C, E에 해당합니다. 주요 기능 / 동작 방식: - 소스 수집: QnA Maker는 URL(FAQ 페이지), 문서(PDF/Word 등), 기타 지원되는 소스에서 콘텐츠를 수집한 다음 질문/답변 쌍 또는 구조화된 콘텐츠를 추출할 수 있습니다. - 수동 작성: 매칭을 개선하기 위해 대체 질문(동의어)을 포함하여 Q&A 쌍을 추가, 편집, 선별할 수 있습니다. - Chit-chat: 일반적인 대화 문구를 처리하기 위해 미리 정의된 chit-chat 성격 데이터셋(예: “friendly” 또는 “professional”)을 가져올 수 있습니다. 운영 측면에서 authoring 후에는 knowledge base를 train하고 publish해야 봇 또는 애플리케이션 endpoint에서 쿼리할 수 있습니다. 흔한 오해: 옵션 B는 “모델 학습”이 ML처럼 들리기 때문에 그럴듯하지만, QnA Maker는 질문 데이터셋에 대해 Automated ML로 생성되는 것이 아닙니다. 이는 AutoML 워크플로가 아니라 authoring과 ranking을 제공하는 관리형 Q&A 매칭 서비스입니다. 옵션 D는 배포 채널과 콘텐츠 생성을 혼동한 것입니다. Cortana(또는 어떤 채널이든)에 연결하는 것은 봇을 어디에서 사용할 수 있는지에 관한 것이지, Q&A 텍스트를 작성하는 방법이 아닙니다. 시험 팁: AI-900에서는 QnA Maker authoring 방법을 기억하세요: URL/문서 수집, 수동 입력, 내장 chit-chat. 또한 “콘텐츠 생성”(knowledge base authoring)과 “게시/통합”(Bot Framework 채널, endpoint)을 구분하세요. 선택지가 채널 또는 AutoML 학습을 설명한다면, 대개 QnA Maker authoring 방법이 아닙니다.