ITスタッフの推定-Markの黙想

もともと1991年に公開された
2000年、2017年、および2021年のマイナーな更新

「組織には何人のITスタッフが必要ですか?”は、一般的に尋ねられ、質問に答えることは困難です。 魔法の比率はありません。 理想的な人材派遣のレベルはありません。 適切なスタッフの数は、IT組織が何を担当しているか、各責任領域で期待されるサービスのレベルによって異なります。

この記事は、主に古典的な企業のIT人材派遣についてです…IS/ITソリューションが提供されている会社や大学の中で何が起こるか。 関連していますが、サービスとしてソフトウェアを提供している本番サービスを実行することは、エンタープライズコンピューテ CIOには、サービスプロバイダーに対して企業をベンチマークするときに何が起こるかを示す簡単な記事がありました。 私は、高品質のサービスを運営するための私のヒントでこれらの問題のいくつかを議論します。 ジェームズ-ハミルトンは、メガスケールの運用では、人間のスタッフが全体のコストの10%未満を占めていると指摘している。

スライドデッキには、IBM Researchの人々による情報管理アプライアンスがあり、エンタープライズコンピューティングのためのハードウェアのコストと比較して、人員のコストがどのように上昇しているかを把握しています。 運用環境では、通常、インフラストラクチャやツールへの投資が大幅に多くなり、エンジニアリンググループと運用グループの間で作業が共有されることがよくあり、このホワイトペーパーでしか示唆していない規模の経済がしばしばあります。

ITスタッフが行うこと

ITチームが提供することが多いさまざまな種類の作業があります。

ユーザーサービス(ヘルプデスクなど)

どのくらいのハンドホールドが期待されていますか? いくつかのサイトでは、かなり自給自足であるユーザーを持っています; 他のサイトでは、彼らが行うすべてのための支援を必要とするユーザーを持っています。 ユーザーは自分自身の世話をすることができますか、または管理者が最も簡単なタスクでさえも実行する必要があり、必要ですか? たとえば、ユーザーが最も基本的なタスク(ファイルをあるディレクトリから別のディレクトリに移動するなど)を実行することを要求する友人がいます。 単にテキストエディタを起動したりメールを読んだりしていないものは”UNIX”であり、したがって管理者の仕事です。 この種のサポートには、4人のユーザーごとに1人の管理者のような比率が必要です。

サイトでは、ワークショップを実施したり、広範な地元の文書を準備したりしていますか? 技術的な問題についてどの程度相談することが期待されていますか? OSXのようなオペレーティングシステムだけに関心を持っていますか、ヘルプデスクがアプリケーションや開発ツールを支援していますか? たとえば、サイトにTeX、Mathematica、C++、Python、X11、R、MySQL、およびGoogle G-Suiteのヘビーユーザーがいるとします。 ユーザーサービスは、これらすべてのトピックに関する詳細な質問に答えることができるはずですか? 少数の人々はすべてのこれらの事の専門家である。 特定のトピック領域における専門知識の開発には、その領域で遊び、実験し、成熟する時間が必要であり、誰かが習得できる領域の数には限界があります。

ソフトウェアサポート

パブリックドメインのソフトウェアやフリーウェアをどのくらいインストールしたいですか? 彼らはどのレベルのサポートを期待していますか? Rpmのインストールは通常非常に簡単です。 ソフトウェアをコンパイルしてインストールするだけでは時間がかかりません。 しかし、多くの場合、ソフトウェアはコンパイルして適切にインストールするだけではありません。 多くの場合、解決が困難なパッケージ間の競合があります。 多くの場合、ソフトウェアには、ソフトウェアを特定のサイトで使用する前に変更する必要がある前提があります。 さらに、管理者は、ソフトウェアのメンテナンス(バグ修正、セキュリティパッチ、およびそうでないもの)を継続し、ソフトウェアの使用の専門家になるこ コンパイルとインストール(頻繁なパッチと相まって)または多くのハードウェア/ソフトウェアプラットフォームは、わずか数のソフ これにかかる時間は、ソフトウェアの品質と複雑さによって異なります。 Kermitやperlの現在のバージョンを維持することは難しいことではありません(私は誰もがlarry Wallがperlで持っているように素敵な仕事をしたいと思います)。g++に

クラウドサービスのサポート

今日、組織はビジネス上の問題を解決するためにクラウドサービスを使用しています。 クラウドサービスのスタッフ時間は、分散される傾向があるため、多くの場合、推定されていません。 まず、搭乗時のコストです。 多くの場合、これは誰かが会社のクレジットカードを使用してサービスにサインアップするとすぐですが、それは持続可能ではありません。 まず、請求は本当に組織ではなく、個人に行く必要があります。 しかし、より重要なのは、正しい人々がアクセスできるようにすることであり、人々の役割が変わったり、会社を辞めたりするときよりも、正しいことが起こ最良のケースでは、SaaSは、Google Appsなどの既存のアカウント管理システム、Oktaなどのエンタープライズシングルサインオンシステム、または外部から到達可能なSaMLエンドポイントを提供する場合は内部ADサービスを活用できます。 シングルサインオンアカウントを無効にすると、アクセスがブロックされるようにするには、Canを作成する必要があります(一部のシステムでは、サー 一般的に搭乗アプリは約1週間/アプリであり、サービスについての学習、統合の手配、適切なドキュメントの作成に考慮しています。

SaaSを導入するだけでなく、統合の複雑さ、カスタマイズの必要性、ITチームが顧客サポートを提供する必要があるかどうかによって、可能なコストは広

ERPシステム

ますます複雑化し、規制されている世界では、組織は幅広いプロセスを追跡し、管理する必要があります。 作業のペースが増加するにつれて、データはリアルタイムで利用可能である必要があるが、エンタープライズリソース計画(ERP)システムの採用につながってい この分野で最もよく知られているシステムは、SAPとOracleのアプリケーションスイートです。 中間層にはNetsuiteやWorkdayのような企業があります。 中小企業のために、Quickbooksは一般的に使用されています。

小規模な組織では、ERPシステムは、多くの場合、機能を担当するチームによって管理されます。 財務会計ソフトウェアの世話をします。 人事は、多くの場合、人員を管理するために使用されるどのようなツールの世話をし、給与計算を行うために選択したものは何でもシステムファイナ このような場合、ITスタッフはかなり最小限であり、通常はサーバーを提供し、データが定期的にバックアップされることを保証することに集中していま

企業が成長し、規模と複雑さが増すにつれて、これらのシステムの要件は大きく成長する可能性があります。 ERPシステムの人員配置要件の推定について議論するのは、この記事の範囲を超えていますが、私は一つの観察を行います。 ほとんどの場合、既存のビジネスプロセスに正確に一致するようにERPシステムをカスタマイズするのは悪い考えです。 可能な限り、できるだけ箱から出してすぐに近いシステムを使用する必要があり、選択がプロセスを変更したり、ソフトウェアをカスタマイズしたりする場合は、プロセスを変更してください。

カスタムソフトウェア

多くの組織には専用のソフトウェアエンジニアリング部門がないため、ITスタッフはベンダーが提供するソフトウェアを管理するだけでなく、ユーザーコミュニティのためのオンデマンドツールを作成するよう求められています。 これは、特にITスタッフが唯一のプロのプログラマかもしれない小さなサイトでは、理解できます。 この期待がある場合は、この開発プロセスに時間を割り当てる必要があります。

サイト計画/管理オーバーヘッド

管理者はどのくらいのサイト計画を処理する必要がありますか? 管理者は、平均的な人が115ワットを生成することを知っている必要があり、それを考慮し、適切なAC/暖房負荷と電力をスケールするために機械からの熱負荷をどのように考慮する必要がありますか? どのくらいの書類がありますか?

ハードウェア/ネットワークメンテナンス

誰が天井を這って電線を引っ張るのですか? イーサネットが狂って行くために開始したときに誰が薄片状のトランシーバを見つけますか? ワークステーションが死ぬとき、秘書はちょうどあなたの売り手を呼び、待つか、またはより創造的な解決は要求されるか。 あなたはボードレベルの修理をしていますか? あなたの場所はすべてのペリフェラルをすぐに取付けることを買うか、または部品の購入によってお金を貯め、統合をあなた自身するか。 ITスタッフがこれらのことのいずれかを行うには時間がかかります。

技術を予測する

ITスタッフは新しい技術を予測し、新しいアプローチについて会社に助言することになっていますか? 私が働いているほとんどの場所は、ITスタッフが有望に見える最先端の技術と新技術(製品だけでなく、研究も)に良い感触を持っていることを期待し 予想は、多くのサイトが三から六年の計画や減価償却スケジュールを持っている与えられた多くの場合、必要です。 私たちの分野に追いつくことは容易ではありません。 現在のままにするために多くのものを引き出す様々な情報源があります。 私は現在の情報のための様々な良い情報源を発見しました。 貿易ぼろはあなたに販売されているものの絵を与えることができ、ブログ(および他の電子メディア)は、現在の問題や問題に関する質問に最適です。 ACM、IEEEなどの専門誌は、ほとんど行われている研究の最前線で何が起こっているのかを見るのに便利です。 しかし、プロの連絡先の良いネットワークのための代替はありません。 このネットワークは、電話、電子メール、オンラインコミュニティへの参加、会議への出席で維持できます。

マイレシオ

必要な管理者の数を見積もる最良の方法は、必要なサービスレベルと、さまざまな要因(ネットワークインフラストラクチャやサポートされているマシンの異質性など)がそれらの責任の履行にどのように影響するかを把握することです。 まれに、システム管理者が”管理者”タスクのみを実行しています。 この記事の最初の部分では、バックアップ、新しいユーザーのインストール、オペレーティングシステムのメンテナンスなど、通常の”管理者”タスクに加えて、自分 追加のタスクは、質問の形で(ほとんどの場合)提示されます。 第二部は、スタッフのレベルに影響を与える様々な要因のいくつかを詳述しています。 第三部では、システム管理者が環境をより簡単に管理できるようにするために採用できるいくつかの簡単な視点を詳述しています。 最後に、私はすぐにあなたの人材派遣のニーズを近似するのに役立つかもしれないいくつかの比率を調べることによ

以下は、人材派遣の要件を見積もるために使用する非常に大まかなルールセットです。 あなたの走行距離は異なります。 これらの数値は、合理的に安定した環境を維持することを前提としていることに注意してください。 ユーザーベース、マシン、異常に頻繁なソフトウェアの変更、環境の成長などの急速な売上高は、より多くの作業をもたらし、比率に影響を与えます。

作業の種類 ベストプラクティスのパフォーマンスとスケーリング係数を提供する労働単位
エンドユーザーサービス 良いサービスを得る50人のユーザーに1ユニット。 基本的なサービスを受けるすべての200人のための1ユニット、および(例えば、教育工場の学生)8×5サポートを想定しています。 別のカスタマーケア組織でサービスを実行している場合は必要ありません。 あなたはヘルプデスクが延長時間を実行したい場合は、比率が上がる必要があります。
24 x7サポート(パートナー、クライアントなど) 積極的な通知と迅速な問題解決を必要とする24×7NOCを実行することは、管理されているサービスの複雑さとハイ 本当にこれを気にする場所は、14人のコストのステップを持っています…マネージャー、アシスタントマネージャー、三つのシフト、各シフトは二人を持っています、一つのシフトは日曜日-水曜日を実行し、もう一つのシフトは水曜日-土曜日を実行しているので、チーム、クリーンハンドオフ、およびグループトレーニングを行うための時間の間に重複があります。 これは簡単にカバーされていないシフトにつながることができます少なく。 たとえば、夜勤の人が眠りに落ちた場合、または週末のシフトのいずれかを働いている人が病気になった場合、一人の人/シフトを持つことは失敗す これはエスカレートする人々をカウントしません。 シフトごとに必要な人の数は、通常の作業の量と、チームが処理できると予想される同時災害の数に関連しています。
オペレーティングシステム管理 基本的なサポートを必要とするOSのそれぞれのための2単位。 あなたが主流/テストされたスケールを超えてOSをプッシュしている場合は、追加4単位を追加します。 ハッキングされたカーネル、非標準のデバイスドライバなどを必要とする非常に複雑なことを行うと、4単位を追加します。 あなたが本当にセキュリティを気にしている場合は、追加の12単位を追加します。 この時点でカーネルにない機能、および/またはインストールと管理のための基本的なjumpstartまたはkickstart以上のものが必要ですか? ソフトウェア開発プロジェクトのようにこれを管理し、それに取り組んで良いエンジニアを取得します。
ハードウェア管理/ホストイメージング(OS展開) ユーザー(多くの環境のWindows)からOSおよびシステム構成を保護できない場合、またはITスタッフが行う必要があ ユーザーを妨げないでユーザーからOSを保護できれば200箱毎のための1単位はそれの見落としなしで自動的に造り/再構築/更新OSおよびソフトウェアであ ネットワークベースのソフトウェアインストール(コンピューティングクラスターまたは構成管理を備えた完全に自動化されたユーザーワークステーション)を備えた400ボックスごとに1ユニット。 非常に大規模な操作(完全にクッキーのカッターを動かす機械の1,000s)は500箱/単位のような多くを拡大し、すぐに処置をとる必要なしで完全な棚/サービス単位を失うことをできるgoogleのスケールで2500箱/単位高く拡大するかもしれません。
Applianceサポート 各シンプルなアプリのための1ユニット。 スタッフがパワーユーザーであることが期待されている任意の複雑なアプリのための4単位。 通常、アプリの初期展開には時間がかかります。 多数のアプリが展開されている場合は、スタッフがコンテキストスイッチ/”スワップイン”情報にかかる時間を考慮する必要があります。
単純なネットワークサービス 二つの基本的なサービスごとに1ユニット:httpd、DNS、メール、印刷、SAMBAなど。 あなたはそれらが99.8%以上の可用性を持っているしたい場合は、2台を追加します。 セキュリティを気にする場合は、2ユニットを追加します。 平均よりも大きくスケーリングする場合は、1単位を追加します。 あなたはメガサイズにスケーリングし、ソフトウェアがのために設計されたものを超えている場合は4を追加します。 完全に規模を超えている場合は、開発プロジェクトとスタッフをエンジニアとそれに応じて扱います。
複雑なネットワークサービス 非常に可変。 たとえば、データマイニングに使用されるマルチテラバイトのデータベースは、パフォーマンスチューニングや大規模なストレージシステムに特化した複数のdba+複数のシニアシステム管理者を簡単に消費する可能性があります。
ネットワーク接続 は、ネットワークデバイスの数、ネットワークの数、セキュリティの問題、ルーティングの複雑さ、HA要件に応じてスケールします。
調整と管理 組織が大きく複雑になればなるほど、調整の役割が必要になります。 人間管理、システムアーキテクチャ、プログラム管理、プロジェクト管理に焦点を当てた人々。 これは非常に複雑です。 比率を提案するのはおこがましいでしょう。

solid SAGE IIシステム管理者は、4つの作業単位を処理できます。 強力なSAGE IIIシステム管理者は、8単位の作業を処理できます。 優れたSAGE IVシステム管理者は、12単位の作業を処理できます。 深いと幅広い経験の両方を持っているいくつかのまれな個人があります,箱の思想家の外にあります,高いEQ,そして信じられないほど集中し、生産. 彼らは、SAGE IVレベルの人よりもエンドユーザーサポートのような人間のタスクに対して優れているわけではありませんが、技術/システムの作業では大幅に これは、「通常の」開発者よりも10倍優れた開発者がいるという伝承に関連しています。 私のキャリアの上にこれらの例外的な実行者の何人かと働く喜びを有した持っている。 このカウントシステムは、Sherwood Botsfordによって提案され、compで見つかった方程式に大まかに基づいています。unix。管理者よくある質問。 いくつかのポイント私は私のSREスキルマトリックス(excel)を使用するようにカウントを更新します。

その他の問題

一人の管理者がいるサイトはあまり望ましくありません。

多くの小さなサイトは複数のシステム管理者を買う余裕も正当化もできないので、彼らは人生の事実です。 どんなに少数のマシンを持っていても、一人の人が本当に一流のサイトを運営するための幅広い知識と経験を持つことは困難です。 常に唯一の管理者の強さではないいくつかの領域があります。

もう一つの問題は、単一のシステム管理者を持つサイトが単一障害点を持っていることです:管理者が休暇中(またはバスに轢かれた)とき、サイト 休暇のポケットベルを運ぶことは楽しみの私の考えでない;但し、誰も危機がいつ起こるかもしれないか予測できない。 もちろん、それはまた、バックアップテープを変更し、天井を介してクロールすることを含む仕事で高レベルの人に興味を持つのは難しいです。

サイトが均質であればあるほど、サポートが容易になります。

サポートされているプラットフォームの数(異なるマシンアーキテクチャまたは異なるオペレーティングシステム)は、サポートタスクの複雑さを増加させます。 オペレーティングシステムのアップグレードは、プラットフォームごとに少なくとも一度は手で行う必要があります。 各オペレーティングシステムは、それが学習し、習得する必要があり、独自の特異性を持っています。 ほとんどのサイトでは、ユーザーがワークステーションのいずれかに座って作業を行うことができるように、すべてのプラット これには、各プラットフォームに同一のツール、ウィンドウシステムなどが必要です。 これにより、管理者が行う必要がある作業量が大幅に増加する可能性があります。 最良の状況では、これは各プラットフォームのプログラムを再コンパイルすることを意味します。 最悪の状況では、ソフトウェアを移植し、ベンダーが提供するソフトウェアと戦う必要があります。 私の個人的な悪夢は、すべてのX11R4(MITから)、DECwindows、OSF/Motif、およびSunのOpenWindowsを3つの異なるプラットフォームでサポートしようとしています。

大規模なサイトは規模の経済を悪用する可能性があります。

大規模なサイトは、ユーザー(またはワークステーション)の数が増えるよりも、管理スタッフを急速に拡大することができます。 この理由は、あなたのスタッフが大きくなるにつれて、人々が専門化することが可能であるからです。 この専門化により、個々のスタッフは、特定のトピックに関するすべての問題を理解し、どのような問題が発生してもより迅速に解決できるように、専門知識の深さを開発することができます。

次に、大規模なサイトは以前の作業を活用できます。 マシンまたはソフトウェアの最初のインストールは、常に最も困難です。 第二は簡単です。 50または100のインストールを行った時点で、自動スクリプトを開発し、スリープ状態でインストールを行うことができます。 私は物事がかなりうまく走った1:100の管理者対マシンの比率で大規模なサイトを見てきました。 私は読者に注意しなければなりません:この種の比率は、何百人ものユーザーがいる慎重に設計された環境で働いている一流の人々でのみ実現可能です。 ほとんどのサイトは、この種の比率で生産的な作業を行うことはできません。 彼らは日々の問題や消防で自分の時間のほとんどを過ごすことになりますので、比率のこの種はまた、システムスタッフのメンバーの専門的な成長を制 組織の最も貴重なリソースは、その人であるため、これは残念です。

SA効率の向上 SA効率の低下
自動化
標準(ポリシー、アーキテクチャ)
効果的な監視
共通ツール
堅牢なISセキュリティ
HW/SWベースラインにロードされるものを厳密に制御
重要なサービスの冗長性
サービスの分離(単一のサービスマシン)
優れたトレーニングプログラム
システム別の詳細な災害復旧計画
バックアップを必要としないシステム
多様なハードウェアベースライン
多様なソフトウェアベースライン
laxは セキュリティ
ほとんどまたはまったくトレーニング
積極的ではなく、反応的なスタッフ
アドホックバックアップまたはバックアップなし

高可用性サイトでは、より高い人材派遣が必要です。

高可用性を必要とするサイト(例えば99.9%を超えるサービス提供)には、より高いレベルの人材派遣が必要です。 この理由は、あらゆるサービスの問題(例えば、24×7のカバレッジ、理想的には少なくとも2人の深い第一および第二のレベルの解決を行うことができ、主題領域の専門家にエスカレートすることができる人)にほぼすぐに対応できる人が必要である。 また診断にでき、複雑な問題をすぐに解決する各主題区域のための多数の人々がある必要があります。

他のプラットフォームはどうですか?

サポートされているプラットフォームは大きな違いをもたらします。 私の経験では、MacintoshとUNIXコミュニティのサポートはほぼ同じ人員レベルを取るということです。 歴史的に任意のMicrosoft OSを実行しているPcのサポートは、少なくとも二重の人員を必要とし、サービスの低レベルを提供するようです。 Windows XP以降、比率はそれほど高くする必要はありません…しかし、私はまだWINDOWSよりもUNIX上で管理スケールが優れていることがわかります。

他の人の比率

ここ数年、彼らが合理的だと思う比率について話している人がたくさんいました。 人口に多少の変化があり、多くのカスタム作業がある1:60のスタッフ/ユーザー比、および1のスタッフ/ユーザー比について話している人を聞くのが一般的です:150(またはそれ以上)”クッキーカッター”ソリューションを使用することができます場所では、例えば、人々はツールとしてコンピューティングを使用している学部生や企業の大群と大学ではなく、管理されているマシン上で革新するために探しています。 より現実的な比率のセット(tcoのベンダーのホワイトページではなく、現場のベストプラクティスに基づいて)は、Mega Groupの人材派遣比率の改善の記事でした。 現実の世界では、ほとんどの組織が30:1を超える比率をサポートできていないことを発見した他の多くの研究があります。 2000年のMitreの研究では、比率は47であることが示唆されています。1 +/- 17%。 Justin Nguyenによるユーザーと技術者の比率に関するビデオでは、60:1の基本比が提案され、この比率に影響を与える多くの要因がありました。

過剰な数字の例は、教育機関のための白書であるStaffing for Technology Supportで見つけることができます。 残念ながら、これらの人々は、MITのプロジェクトAthenaからの人員比率を世界の他の地域に適用しようとしています。 これは3つの理由で欠陥があります。 まず、ほとんどのサイトにはAthenaが持っていた洗練されたツールがありません。 第二に、アテナには、多くの仕事をした学生ボランティアと、MITの要件を満たすツールを開発したハードコアシステムプログラマという、アテナを実行させる人がいました。 最後に、MITsユーザー人口は平均的なユーザー人口ではありません。

Gartner GroupのDavid Cappuccioは、彼の記事で”タイプを知っている:サポートスタッフのサイジングアップには、考慮する必要がある二つの比率があることを提案しました。 最初の比率は、スタッフとユーザー、方程式の人間の部分をキャプチャしようとする試みです。 この比率は、多くの場合、ティアI、ヘルプデスク、またはユーザーサポートと呼ばれることを行う必要がある人の数を見ています。 第二の比率は、技術インフラの世話をするために必要とされるどのように多くの人々をキャプチャしているスタッフあたりのマシンとサブシステム 私はDavidのフレームワークが好きですが、彼の比率はユーザーサポートには高すぎて、ほとんどの組織が展開する多様な技術セットを捉えることができなかった ディレクトリ、セキュリティ、メッセージング、および共同作業サービスがあります。 問題を複雑にするために、多くのサイトは異種であり、すべてのクライアントに対して一つのサービスを動作させるために余分な努力を必要とするか、 最終的に複雑な要因は、これらのサービスには複雑な相互作用と依存関係があることが多く、展開と保守がより困難になることです。 その結果、Davidの比率は、適切なレベルで最も基本的なサービスのみを提供することができる人材派遣をもたらすことになります。

itbenchmarkブログには、スタッフのサイジングに関するトピックに関する投稿が数多くあります。

結論

必要な管理者の数は、サイトによって大きく異なります。 一つの定数は、彼らが持っている責任のために十分なシステム管理者がめったにないということです。 これが最初に書かれた時点で、私は一人で220台のマシン(三つの異なるプラットフォーム)を維持し、約80人のかなり洗練されたユーザー人口に適切なユーザーサー 私の時間は、ユーザーサービス(30%)、一般的なシステム管理タスク(20%)、新しいマシンとハードウェア/ネットワークサポートのインストール(10%)、ソフトウェアのインストールとメンテ これは135パーセントまで加算されることに注意してください。

この投稿の履歴

1991年、私は人材派遣比率に関する質問に答えるメモをUsenetに投稿しました。 Rob Kostadは、その短いメモを”何人の管理者が十分ですか? 1991年4月、雑誌『Unix Review』に掲載された。 長年にわたり、私は元の記事にいくつかの、主にマイナーな更新を行ってきました。 これらの日の一つは、私は完全にそれを書き換えるでしょう。 この記事はずっと前に書かれていましたが、私は比率がまだかなり正確であることがわかります。 私が間違っていることを考えれば、私にあなたの経験の郵便を送って下さい。

コメントを残す

メールアドレスが公開されることはありません。