平成26年春期試験午後問題 問10

問10 サービスマネジメント

⇱問題PDF
サービス継続及び可用性管理に関する次の記述を読んで,設問1~4に答えよ。
 E社は,家電を中心としたインターネット通販業を営む中堅企業である。5年前から"E社ショッピング"(以下,サービスAという)という仮想商店街サイトを開設し,顧客に商品を販売している。競合先が多い中,価格の安さとWebサイトの使い勝手の良さで,業績は好調である。サービスAを支える顧客管理システム及び販売システムは,安定運用期に入っている。
 システム運用部は,発生したシステム障害への対応を行い,根本原因を究明する。そして,一時的な回避策を含めてインシデントとして記録する。インシデントの記録を蓄積して分析することによって,インシデントの調査・診断の作業手順において成果が現れている。
 E社は,半年前にクレジットカード会社と提携して,商品購入代金をクレジットカードで決済できるようにした。同時に,クレジットカードの機能をもった"E社カード"を発行し,商品購入額に応じてポイントを付与するサービスを開始して"E社カード"発行の申込みを促進させた(以下,クレジットカード関連のサービスをサービスBという)。サービスBを支える決済システム及びカード連携システムの運用を開始した。しかし,インシデントの記録は,まだ十分に蓄積されておらず,サービスAに関するインシデントの記録を参考にする程度である。
 E社は,年中無休で24時間サービスを提供している。可用性を高めるために,各サービスコンポーネントを冗長化構成にしている。E社のシステム全体構成を図1に,システム機器などのサービスコンポーネントと両サービスの関係を表1に,それぞれ示す。
pm10_1.png
 両サービスは,表1中で"○"印が付いたサービスコンポーネントで構成されていて,そのいずれかのサービスコンポーネントが故障した場合にサービスが中断する。各サービスの可用性は,サービスAがa,サービスBが 0.995 である。また,サービスBのMTBFを1,990時間とすると,MTTRはb時間である。

〔可用性を高めるための方策〕
 システム運用部のF君は,E社システムの稼働状況を日々監視している。管理指標として"サービスの可用性"を設定し,定期的に測定・分析・評価を行っている。その結果を基に,可用性を更に高めるための方策を検討した。
 最初に,サービスの中断時間を最小限に抑え,ビジネスへの影響を極小化するために,サービスコンポーネントが故障した場合のサービスへの影響を,表1から調べた。①ファイアウォール,Webサーバ,社内LAN及びDBサーバAは,影響度が高い。また,クレジットカードの処理は,提携クレジットカード会社との連携を行うので,他の処理よりも重要度が高い。
 サービスコンポーネントを増強すれば可用性も向上するが,システム構築費用も高くなる。F君は,費用対効果の良いサービスを提供するために,要求されるサービスの品質とそれを実現するための費用を適切にバランスさせることが必要だと考えた。

〔サービス中断時間の短縮〕
 次に,F君は,サービスBに関してサービスコンポーネントが故障した場合の復旧作業の所要時間を調べるために表2を作成した。過去5年にわたって改善を施してきたサービスAの値をベンチマーク(評価水準)とし,サービスBにおける(ⅰ)~(ⅵ)の復旧作業手順ごとの所要時間の割合を比較すると,(ⅲ)と(ⅴ)での割合が高かった。故障1件当たりの平均サービス中断時間は,サービスBの方が長かった。また,故障の復旧作業に掛かる作業工数の削減が課題になっていた。このことから,F君は,サービスBでは,(ⅲ)と(ⅴ)に改善の余地があると推測した。ここで,同一の作業員が両サービスの復旧作業を担当しているので,作業スキルには差がない。
pm10_2.png
〔継続的なサービス改善活動〕
 F君は,サービス改善活動の管理指標として,"サービスの可用性"に加えて"故障原因の診断の正確性"を設定しようと考えた。改善の余地がある診断作業において,より正確に診断すれば,復旧時間の短縮が期待できるからである。復旧作業を行った担当者とその上司が,診断作業において良かった点,改善すべき点を話し合って,診断の正確性を評価することにした。F君は,管理指標の追加について,上司であるG課長に相談した。すると,G課長から,② 「"故障原因の診断の正確性"に替えて,時間が測定できる指標にしたらどうか」と指摘された。F君は,G課長からの指摘に従って"サービス中断時の平均復旧時間"を新たな管理指標とし,モニタリングとデータ収集の方法を決めて,実施した。
 1年後,F君は,収集したデータを分析し,目標の達成状況の評価,是正処置の要否の検討を行い,レポートにまとめた。その結果,"サービス中断時の平均復旧時間"が短くなり,サービスの可用性が向上したことによって,③顧客満足度が上がっていることが分かった。

設問1

本文中のabに入れる適切な数値を答えよ。
aは,小数第4位を四捨五入して,小数第3位まで求めよ。

解答例・解答の要点

a:0.996
b:10

解説

aについて〕
サービスAの可用性(稼働率)を計算する問題です。
表1の"サービスA"列より、サービスAで使用しているサービスコンポーネントは以下の5つであることが読み取れます。
  • 1.ファイアウォール
  • 2.Webサーバ
  • 3.社内LAN
  • 4.APサーバA
  • 6.DBサーバA
問題文中には「いずれかのサービスコンポーネントが故障した場合にサービスが中断する」と記載されているので、全コンポーネントが直列接続されている構成として可用性を計算することになります。

サービスAを構成する5つのコンポーネントの可用性を掛け合わせると、

 1×0.999×1×0.999×0.998=0.996005...
 (小数点第4位を四捨五入して)0.996

a=0.996

bについて〕
サービスBのMTTRを求めます。
MTBF(Mean Time Between Failures)とは、システムの修復が完了し正常に稼働し始めてから次回故障するまでの「平均故障間隔」、MTTR(Mean Time To Repair)とは、システムや機械が故障してから復旧するまでにかかる「平均修復時間」です。

MTBF、MTTR、可用性については以下の公式が成立します。この公式は午前問題でも過去に何度か出題されているので、覚えておきましょう。

 可用性=MTBF/(MTBF+MTTR)

この公式に問題文中のサービスBの可用性・MTBFを当てはめ、方程式を解くと、

 0.995=1,990/(1,990+MTTR)
 1990+MTTR=1,990/0.995
 1990+MTTR=2,000
 MTTR=10

サービスBのMTTRは10時間とわかります。

b=10

【別解】
MTBFは平均故障間隔、可用性は全運用時間に占める稼働時間の割合ですので、

 1,990÷0.995=2,000

で全運用時間を計算し、

 2,000-1,990=10

でMTTRを算出することも可能です。

設問2

本文中の下線①で,これらのサービスコンポーネントの影響度が高い理由を40字以内で述べよ。

解答例・解答の要点

サービスコンポーネントが故障した場合,両サービスが中断するから (31文字)

解説

システム運用部のF君が下線①で「ファイアウォール,Webサーバ,社内LAN及びDBサーバAは,影響度が高い」と判断した理由を考えます。

下線①の直前に「サービスコンポーネントが故障した場合のサービスへの影響を,表1から調べた」と記述があるように、表1から解答を導出できます。表1のファイアウォール、Webサーバ、社内LAN、DBサーバAの行を確認すると、"サービスA"列、"サービスB"列の両方で「○」になっています。これにより、これらの4つのコンポーネントは両サービスで使用されているという共通の特性があることがわかります。
pm10_3.png
そのため、これらのコンポーネントが故障した場合、両サービスとも中断してしまうことになります。F君はこの状況を踏まえて、これらのコンポーネントの故障について「影響度が高い」と判断したと考えられます。

∴サービスコンポーネントが故障した場合,両サービスが中断するから

設問3

サービス中断時間の短縮について,(1),(2)に答えよ。
  • サービスAと比較して,サービスBでは表2中の(ⅲ)の復旧作業手順の所要時間の割合が高い。この原因として考えられる理由を30字以内で述べよ。
  • サービスAと比較して,サービスBでは表2中の(ⅴ)の復旧作業手順の所要時間の割合が高い。サービスBの(ⅴ)の所要時間を短縮する施策として最も適切なものを解答群の中から選び,記号で答えよ。
解答群
  • 故障発生時の連絡フローの見直し
  • サービス継続計画の作成
  • サービス再開始手順書の見直し
  • サービスデスクの応答時間短縮を目的とする教育
  • 復旧作業員のスキル向上を目的とする教育

解答例・解答の要点

  • インシデントの記録が十分に蓄積されていないから (23文字)

解説

  • 表2中の(ⅲ)の復旧作業手順の説明として、「インシデントを調査し, 診断を行う」と記述されているので、何が原因でサービスBのインシデントの調査及び診断に時間がかかっているのかを解答する必要があります。

    サービスBのインシデントについては問題前文に

    「サービスBを支える決済システム及びカード連携システムの運用を開始した。しかし,インシデントの記録は,まだ十分に蓄積されておらず,サービスAに関するインシデントの記録を参考にする程度である」

    と記述されています。

    インシデントの発生時には、既知の問題データベースを検索し、過去に同様のインシデントが発生していないかなどを確認します。ここで、回避策(ワークアラウンド)が登録されていればインシデントは解決しますが、新規の問題であれば問題調査フェーズに進むことになります。このため、インシデントの記録が十分に蓄積されていないと、インシデントを解決する際に参考とする事例を見つけることができず、調査・診断に時間がかかってしまいます。

    このため、インシデントの記録が十分に蓄積されていないサービスBでは、インシデントの調査及び診断作業の所要時間の割合がサービスAに比べて高くなっていると判断できます。

    ∴インシデントの記録が十分に蓄積されていないから

  • 復旧作業の所要時間を短縮する施策を解答する問題です。この設問は消去法によって選択肢を絞ることができます。

    まず、〔サービス中断時間の短縮〕の最後に「同一の作業員が両サービスの復旧作業を担当しているので,作業スキルには差がない」と記述されています。これにより、作業員やサービスデスクの教育について述べている「エ」及び「オ」は施策として不適切であると判断できます。

    次に、表2中(ⅴ)の作業説明として「サービス開始手順書に従い、サービスを復旧させる」記述されています。そのため、上記の作業に関係のない「連絡フロー」や「サービス継続計画」について述べている「ア」及び「イ」も施策として不適切であると判断できます。

    よって、正解は「ウ」の「サービス再開始手順書の見直し」となります。復旧作業はサービス再開始手順書に従って行われているので、この手順書を見直せば所要時間の短縮できる可能性があります。

    ∴ウ:サービス再開始手順書の見直し

設問4

継続的なサービス改善活動について,(1),(2)に答えよ。
  • F君が管理指標として追加しようとした"故障原因の診断の正確性"について,G課長から本文中の下線②のような指摘を受けた理由を30字以内で述べよ。
  • "サービス中断時の平均復旧時間"を管理指標として追加し,継続的なサービス改善活動を行うことによって,本文中の下線③以外に期待できる効果を25字以内で述べよ。

解答例・解答の要点

  • 診断の正確さの評価基準が客観的ではないから (21文字)
  • 故障の復旧作業に掛かる作業工数の削減 (18文字)

解説

  • F君が"故障原因の診断の正確性"を管理指標として追加しようとしたところ、G課長から時間が測定できる指標に替えるべきだと指摘されています。この指摘理由を解答します。

    〔継続的なサービス改善活動〕に「復旧作業を行った担当者とその上司が,診断作業において良かった点,改善すべき点を話し合って,診断の正確性を評価することにした」と記述されているように、当初F君が追加しようとしていた"故障原因の診断の正確性"は、担当者やその上司による主観的な評価基準であることが読み取れます。

    ITILでは、継続的サービス改善の際に設定する目標として具体的かつ測定可能な値を設定することを求めています。また、一般的に品質管理を行うための管理指標は、客観的(定量的)なものでないと対象の品質を正当に評価することができません。"正確性"という指標は主観的(定性的)なので、評価者の習熟度等によって値が変わりますし、大まかな評価しかできないので管理指標には向きません。そこで、G課長は「時間という客観的に測定できる指標にすべきだ」と指摘しているのです。

    "故障原因の診断の正確性"が管理指標として不適切な理由が問われているので、評価基準が「客観的ではないから」「定量的ではないから」「主観的だから」「定性的だから」等の解答が適切となります。

    ∴診断の正確さの評価基準が客観的ではないから

  • 継続的なサービス改善活動の結果については、問題文の最後で「その結果,"サービス中断時の平均復旧時間"が短くなり,…顧客満足度が上がっていることが分かった」と記述されています。この記述と設問文より、サービスB中断時の平均復旧時間が短くなったことで期待される(顧客満足度の向上以外の)効果を解答すれば良いと判断できます。

    問題文中の関連する記述として、〔サービス中断時間の短縮〕でサービスBについて「故障の復旧作業に掛かる作業工数の削減が課題になっていた」と記載されています。平均復旧時間が短くなるということは、故障の復旧作業に掛かる作業工数が削減されるということですから、"サービス中断時の平均復旧時間"を継続的サービス改善の管理指標とすることで、サービスBの当該課題についても改善を期待できることになります。

    ∴故障の復旧作業に掛かる作業工数の削減
模範解答

Pagetop