令和6年秋期試験午後問題 問11
問11 システム監査
⇱問題PDF
チャットボット導入における開発計画の監査に関する次の記述を読んで,設問に答えよ。
チャットボット導入における開発計画の監査に関する次の記述を読んで,設問に答えよ。
広告
W社は,中堅の家電メーカーである。顧客サービス部では,製品の特徴や使用方法に関する顧客からの問合せなどに回答するコールセンターを運用しており,Web上で顧客からの問合せに対し,定型文で自動的に回答するチャットボット(以下,現行CBという)で作業効率を向上させてきた。
問合せ内容をより的確に解釈するなど,回答の品質向上のために,顧客サービス部長がシステムオーナーとなり,現行CBのベンダーが提供する,ディープラーニングを利用していない機械学習方式のチャットボット(以下,新CBという)を導入するプロジェクトを立ち上げることになった。
企画プロセスの完了を受けて,W社監査部のシステム監査チームは,新CBの開発計画の適切性について監査を実施することになった。そのために実施した予備調査の結果,次のことを把握した。
〔予備調査の結果〕
〔監査手続案の作成〕
予備調査の結果を踏まえて,システム監査チームが作成した監査手続案(抜粋)を表1に示す。〔監査部長の指示〕
監査部長は,監査手続案をレビューして,次のとおりシステム監査チームに指示した。
問合せ内容をより的確に解釈するなど,回答の品質向上のために,顧客サービス部長がシステムオーナーとなり,現行CBのベンダーが提供する,ディープラーニングを利用していない機械学習方式のチャットボット(以下,新CBという)を導入するプロジェクトを立ち上げることになった。
企画プロセスの完了を受けて,W社監査部のシステム監査チームは,新CBの開発計画の適切性について監査を実施することになった。そのために実施した予備調査の結果,次のことを把握した。
〔予備調査の結果〕
- 現行CBの概要と課題
- W社では,季節性のある製品を多く取りそろえているので,顧客から寄せられる問合せ数は,季節性のある製品では季節によって偏りがある。
- 現行CBでは,顧客が入力した曖味な言葉に対応できず,FAQに回答が存在するにもかかわらず,問合せを解釈できずに回答が表示されないことや,誤った回答を表示することがある。顧客が現行CBの回答では不十分と感じた場合には,顧客からの要望で,コールセンターのオペレーターが代わって問合せ対応を実施している。
- 導入効果をモニタリングするために,顧客の入力テキスト,現行CBが表示した回答,現行CBの回答に対して"役立った"かどうかの結果などを,CB回答履歴として保存している。これらの情報を分析し,顧客から"役立った"という評価を得た割合(以下,回答満足率という)を効果測定の指標の一つにしている。
- 新製品については,発売に合わせて新規にFAQを知識ベースに登録している。今回のプロジェクト期間中にも,発売が予定されている新製品が複数ある。
- 現行CBを導入した際には,受入テストを顧客サービス部員が参加せずに開発担当者だけが実施したことから,新製品に関する問合せに対して適切に回答できないなど,本番移行後に混乱を招く問題点があった。
- プロジェクトの概要
これまで,企画プロセスにおいて新CB導入の目的の明確化,システム化計画の立案,及びPoC(Proof of Concept:概念実証)を実施しており,PoCの結果は品質向上の効果を見込めるものであった。現在,開発計画書案を顧客サービス部とシステム部が共同で作成したところである。関係する役員,及び財務部,顧客サービス部,システム部の各部長で構成するプロジェクト運営委員会で開発計画書案を承認する予定である。
今後の開発プロセスにおいて要件定義,追加の機械学習を含む設計,実装,テスト,受入テスト,及び本番移行を予定している。新CBの機能構成を図1に示す。 - 新CBの機能概要と機械学習
- 回答機能には,現行CBよりも改良した知識ベースを備えており,新CBにおいても新製品の発売に合わせてFAQを知識ベースに登録する。新CBでは,類似する言葉を整理して,言葉の関連度合いを格納している用語データベース(以下,類義語DBという)が備わっている。回答機能では,顧客の入力テキストを自然言語処理し,類義語DBと突き合わせることで,顧客の曖味な言葉遣いに対してある程度問合せ対応可能であり,回答満足率の向上が期待できる。
- 新CBの類義語DBは,ベンダーからの納入時には一般的な語句だけに対応している。W社製品に関する語句などを類義語DBに反映するには,二つの方法がある。一つ目は,手作業入力データを基に学習機能に備わる手作業入力機能によって,類義語DBを整備する方法である。二つ目は,現行CBのCB回答履歴から抽出した文章を自然言語処理によって品詞別に分解し,AIモデルによって機械学習することで類義語DBを整備する方法である。
PoCでは,機械学習によって類義語DBを整備する際のサーバ処理に想定以上の時間を要していた。 - PoCにおける機械学習による類義語DBの整備では,現行CBのCB回答履歴から6か月分を学習用データ及びテスト用データとして,ランダムに抽出した。また,回答満足率を指標にして,効果の目標レベルを定め,新CBの有効性を判断している。
- 新CBでは,設計において,追加の機械学習によって類義語DBの精度を高め,回答満足率を上げる想定である。設計後においても,本番運用向けの類義語DBの学習では,再学習を実施する。
〔監査手続案の作成〕
予備調査の結果を踏まえて,システム監査チームが作成した監査手続案(抜粋)を表1に示す。〔監査部長の指示〕
監査部長は,監査手続案をレビューして,次のとおりシステム監査チームに指示した。
- 表1項番1について,設計における追加の機械学習では,類義語DBの整備がスケジュールどおり完了しないおそれがある。機械学習を実行するサーバに対する非機能要件の一つであるeが,PoCを実施した際の実績データから導いた要件になっているか確かめること。
- 表1項番2について,新製品だけでなく,現行のfに関する問合せへの回答について 学習用データが不十分で,適切に回答できないおそれがある。設計における追加の機械学習では,製品を網羅する観点から学習用データを準備する計画になっているか確かめること。
- 表1項番3について,新CBの有効性を確保するために,gに先立って,プロジェクト運営委員会が,当初予定の導入効果が得られる見込みを評価する計画になっているか確かめること。
- 追加する監査手続として,現行CB導入時における問題点を踏まえて,今後の開発プロセスにおいて顧客サービス部によるhが適切に実施される計画になっているか確かめること。
広告
設問1
表1の監査手続案について答えよ。
- 表1中のa,bに入れる適切な字句を,それぞれ5字以内で答えよ。
- 表1中のcに入れる適切な字句を,本文中の字句を用いて5字以内で答えよ。
- 表1中のdに入れる適切な字句を,5字以内で答えよ。
解答例・解答の要点
- a:学習 (2文字)
b:手作業入力 (5文字)
- c:目標レベル (5文字)
- d:レビュー (4文字)
解説
チャットボットには様々な種類がありますが、機械学習型のチャットボットとは、AIを搭載しており、ヒトがあらかじめ登録した学習データに基づき、質問の意図を類推し、回答を出すタイプです。「ディープラーニングを利用していない」と本問で述べられているのは、新CBは人間の手を借りずに質問の意図を類推し、回答を生成する類のものではないという意味です。- 〔aについて〕
〔予備調査の結果〕(3)④には、追加の機械学習は、類義語DBの精度を高めるために実施されるとあります。図1を確認すると、類義語DBの学習機能に入力されるデータとして、❶学習用データ、❷テスト用データ、❸手作業入力データの3種類があることがわかります。この3つが解答の候補となります。
機械学習モデルの作成では、学習データを使用してモデルにパターンを学習させ、テストデータを使用して学習済みモデルの評価を行います。学習済みモデルの評価は、モデルが未知のデータに対してどの程度の予測精度があるかを測定することが目的なので、テストデータは、本番環境のデータ分布を正しく反映し、代表性が確保されていることに加え、学習に使用していないデータであることが必要不可欠です。
本問ではPoCにおいて「CB回答履歴から…学習用データ及びテスト用データとして…抽出した」とあります。一般的には、全データを学習用データとテスト用データとに分割することによってデータの独立性を確保しますが、テストデータに学習データと重複するデータが含まれている場合、テスト結果は良好でも、本番環境では性能が発揮できないことがあります。このように本来モデルの学習時に使用すべきでない情報が含まれてしまう現象を「データリーク」といい、機械学習モデルの構築において注意すべき点の一つとされています。これが表1項番1が想定するリスクです。
以上より、追加の機械学習においてテストデータと別に準備していることを確認すべきデータとは、学習用データであると判断できます。したがって、空欄aには「学習」が当てはまります。
∴a=学習
〔bについて〕
表1項番2のリスクは「類似語DBの整備が不十分であったことによって,新製品に関する質問に対して,新CBが適切に回答しない」というものです。類義語DBの整備に関しては、〔予備調査の結果〕(3)②において❶手作業入力と❷現行CBのCB回答履歴を用いた機械学習の2つの方法が述べられています。
空欄に当てはまるのはどちらかになりますが、課題となっているのは発売前の新製品に関する質問への対応ですから❷の方法は使用できません。現行CBの回答履歴には発売前の新製品に関する情報は含まれていないためです。このため、類義語DBの整備は手作業入力機能を使用して行われるべきであり、監査手続では開発計画がそのようになっているかを確認することになります。したがって、空欄bには「手作業入力」が当てはまります。
∴b=手作業入力 - 〔cについて〕
空欄には、本番移行の可否判断において使用する評価項目ごとに設定されるものが入ります。モデルの評価に関連した記載を本文中から探すと、(3)③において「回答満足率を指標にして,効果の目標レベルを定め,新CBの有効性を判断している」とあります。したがって、開発計画でも評価項目ごとに目標レベルを定め、その基準をもとに本番移行の可否判断を行うことが適切であると読み取れます。したがって、空欄cには「目標レベル」が当てはまります。
なお、同じ5文字で「回答満足率」や「測定の指標」などの解答も想定されますが、これらは評価項目そのものですので適切ではありません。
∴c=目標レベル - 〔dについて〕
監査手続案の項番4は、チャットボットに限らず、システムを導入する際のテスト一般についてのコントロールです。システム管理基準によれば、テスト工程に当たる「検証」のフェーズでは主に次の4つの管理活動を実施することとされています。- 計画
- 検証の範囲、手順、関連システム及びサービス、及び制約を明確にし、スケジュールを調整する
- 結果のレビュー
- システム要件を反映していることを示す裏付けを入手し、レビューする
- 結果の文書化と承認
- 検証結果を文書化し、承認を得る
- 不具合の改善
- 検証で発見された不具合及び改善結果を記録し、不具合の改善状況をフォローアップする
また、システム管理基準では、開発プロセスの実装、統合、検証、受入テスト、本番環境への移行の各フェースでレビューを実施することとされています。このような一般的なシステム開発の知識から回答を導出することもできると思います。
∴d=レビュー
広告
設問2
〔監査部長の指示〕について答えよ。
- 本文中のeに入れる最も適切な字句を解答群の中から選び,記号で答えよ。
- 本文中のf~hに入れる適切な字句を,それぞれ10字以内で答えよ。
e に関する解答群
- 外部インタフェース要件
- 性能要件
- セキュリティ要件
- 保守性要件
解答例・解答の要点
- e:イ
- f:季節性のある製品 (8文字)
g:本番移行 (4文字)
h:受入テスト (5文字)
解説
- 〔eについて〕
〔予備調査の結果〕(3)①では「PoCでは,機械学習によって類義語DBを整備する際のサーバ処理に想定以上の時間を要していた」とあります。この記述より、サーバの処理能力が不足している現状については把握することができます。選択肢の非機能要件のうち処理能力に対応するのは「イ:性能要件」です。性能要件は、システムが満たすべき処理速度や応答時間、スループット、同時接続数、負荷耐性などに関する要件を指します。
その他の非機能要件は以下のとおりです。- 外部インタフェース要件
- 開発するシステムとそれ以外のシステムとの間で発生するデータのやり取りに関する要件
- セキュリティ要件
- システムを機密性・完全性・可用性を確保するための認証、アクセス制御、暗号化などの要件
- 保守性要件
- システムの変更や修正を容易にし、長期間安定して運用できるようにするための要件
- 〔fについて〕
類義語DBの整備が不十分であることによって、発売前の新製品以外でも新CBが適切な回答をしないという問題があることが指摘されています。空欄fの前に「現行の」とあるので(1)"現行CBの概要と課題"を見ると、発売前の新製品以外に、次の2つの点を確認することができます。- 顧客から寄せられる問合せ数は,季節性のある製品では季節によって偏りがある
- 顧客が入力した曖味な言葉に対応できない
PoCではCB回答履歴のうち6か月分を抽出対象としています。季節性のある製品の問合せ数は季節によって偏りがあるため、仮にPoCと同じ範囲で学習データを用意した場合、一部の季節性のある商品については学習データが不足してしまうことが予想されます。これでは適切な回答を期待することはできません。製品を網羅するには、少なくとも1年を通じたデータが必要であり、この点は、監査部長の「製品を網羅する観点から学習データを準備する計画になっているか確かめる」という指示とも整合しています。したがって空欄fには「季節性のある製品」が当てはまります。
∴f=季節性のある製品
〔gについて〕
プロジェクト運営委員会が、当初予定の導入効果が得られる見込みを評価するタイミングが問われています。〔予備調査の結果〕(2)において、プロジェクト運営委員会は開発計画書案を承認する予定であり、その後、「開発プロセスにおいて要件定義,追加の機械学習を含む設計,実装,テスト,受入テスト,及び本番移行を予定している」とありますので、これらフェーズが解答の候補となります。
本プロジェクトでは「設計後においても,本番運用向けの類義語DBの学習では,再学習を実施する」ため、最終的なパフォーマンスはプロジェクトの最終段階まで確定しません。また表1項番3は、受入テストの結果を踏まえて判断する段階に関する記述です。この2点を考慮すると、判断時期は受入テストの次のフェーズである「本番移行」の前しかありません。
∴g=本番移行
〔hについて〕
現行CB導入時における問題点とは、(1)⑤の記載の「現行CBを導入した際には,…新製品に関する問合せに対して適切に回答できないなど,本番移行後に混乱を招く問題点があった」というものです。この問題が発生した原因は「受入テストを顧客サービス部員が参加せずに開発担当者だけが実施した」ことですから、同じ轍を踏まないためには、新CBの受入テストはシステムオーナーである顧客サービス部の主導で実施される必要があります。したがって空欄hには「受入テスト」が当てはまります。
∴h=受入テスト
広告
広告