Pipeline Pilot

エンタープライズ・サイエンスとエンジニアリングの簡素化

データはあらゆる場所で使えるようになりました。しかし、科学やエンジニアリングを扱う多くの組織は、いまだにデータを効率的かつ自由に使うことができないでいます。各チームはデータへのアクセス、クリーニング、モデル化、結果の共有に、異なるツールやプロセスを使用しています。しかしそれらの結果には、イノベーションの推進に必要な技術的な詳細度が足りないことがよくあります。このように一貫性がなく、往々にして専門性に欠けるアプローチでは、効率的なソリューションの開発が阻害され、コラボレーションが困難になり、結果の信頼性が低下します。

データ・サイエンスが持つ可能性を完全に活用するには、科学およびエンジニアリングのエンタープライズ全体でデータを活用するエンドツーエンドのアプローチが必要です。

高度なデータ・サイエンス、AI、機械学習が誰でも使えるように

AI と機械学習の導入が普及したことで、ビジネスの実施方法が、特に科学とエンジニアリング分野で変化しています。しかし、一時的なブームと捉えるのではなく、チームに基礎を重視させる必要があります。Pipeline Pilot では、データ・サイエンティストがわずか数回のクリックでモデルをトレーニングして、モデル・タイプのパフォーマンスを比較し、今後使用するためにトレーニング済みモデルを保存できます。エキスパート・ユーザーは、Python、Perl、または R のカスタム・スクリプトを埋め込んで、組織全体で使用を最大化することもできます。

さらに、Pipeline Pilot は「ブラック・ボックス」ではありません。各モデルはプロトコルに結びつけられているので、組織はデータがどこから取得されたか、どのようにクリーニングされたか、どのモデルが結果を生成したかを把握できます。エンド・ユーザーは予測を信頼でき、最新の機械学習テクニックで科学作業を強化できます。

あらゆる人に対して、AI と機械学習の価値を最大化します。

エンタープライズ・データ・サイエンス・ソリューションを高速化

カスタム・データ・サイエンス・ソリューションの需要が高まっているため、開発者はプロトコル作成を合理化する方法を必要としています。Pipeline Pilot は複雑な機能をシンプルなドラッグアンドドロップのコンポーネントにまとめ、ワークフローに連結することができます。これらのプロトコルは、ユーザーとグループが共有して再利用できるため、ソリューションを迅速に開発して組織全体で標準化できます。

ベスト・プラクティスを、標準化された手順にします。

手動のデータ・サイエンス・ワークフローを自動化

スプレッドシートのピボットから画像解析まで、多数のデータ解析プロセスには、いまだに面倒な手作業が必要です。Pipeline Pilot の利点は、このようなプロセスの自動化です。タスクをスケジュールし、データセットをクリーニングおよび結合し、インタラクティブなダッシュボードをセットアップします。プロトコルもウェブ・サービスとしてセットアップでき、ユーザー・エクスペリエンスがシンプルになります。

付加価値のないタスクを排除して、科学チームが最も得意とする作業、すなわち科学に専念できるようにします。

エンタープライズ R&D および運用: データ主導型

現代の生産性の要件を満たすには、技術を扱うエンタープライズ全体でデータ主導型の文化を育成する必要があります。Pipeline Pilot は、プロトコルを運用化してデータの使用と再利用を最適化できます。機械学習モデルをウェブ・サービス経由で展開します。カスタム・アプリケーションを作成して内部 IP を管理します。既存の IT 環境を統合します。複雑な実験結果または処理結果をインタラクティブなダッシュボードに視覚化します。

サイエンティストとエンジニアのチームの作業を容易にし、スマートに作業できるようにします。

エンドツーエンドのデータ・サイエンス・ワークフローをサポート

開発者、データ・サイエンティスト、「民間」データ・サイエンティストおよびビジネス・リーダーの間で、データ・サイエンス・ソリューションが効率性を発揮するには、包括的に構成して拡張できる必要があります。Pipeline Pilot はエンドツーエンドの自動化ワークフローの作成と実行をサポートします。内部および外部のデータ・ソースに接続し、あらゆる種類の科学データにアクセスして解析します。解析用にデータを準備し、モデルを構築、トレーニング、維持します。必要な場所に、必要なときにサービスを展開します。このすべてを 1 つのワークフローで実行します。

 

アクセス

Pipeline Pilot は、科学とエンジニアリングに特化した、コードをオプションとして使用するグラフィックベースの環境で、複雑なデータ・ワークフローの構築、共有、展開を合理化します。開発者は複雑なワークフローを迅速に作成、共有、再利用できます。データ・サイエンティストはデータ・アクセス、クリーニング、モデル作成を自動化できます。リサーチャーは最新の AI と機械学習ツールを使用して作業を改善できます。ビジネス・リーダーはインタラクティブなカスタム・ダッシュボードで結果をすばやく容易に解釈できます。

必要なときにデータを取得、移行は不要

内部データベース、Hadoop ウェアハウス、クラウド・アプリケーション、フラット・ファイルなどからデータを読み書きします。

  • SQL/NOSQL/MQL
  • 表形式データ
  • 構造化データ(JSON、XML)
  • Office 文書(PPT、Excel など)
  • PDF
  • ストリーミング(KAFKA)
  • 3DEXPERIENCE プラットフォーム
  • REST/SOAP/HTML/S3
  • 広範な API ライブラリを通じて外部データ・ソースに接続
  • さまざまなサードパーティー・データベースにすぐに接続
変換

データ準備と処理を自動化

  • ユーザーが設定したパラメータでデータのクリーニングおよび結合
  • タスクをスケジュールしてデータ準備を自動化
  • プロトコル全体を共有して解析のセットアップ時間を最小化
解析

専門分野固有の機能と解析を運用化

  • すぐに使えるコンポーネントを利用して、データの科学計算を実行
  • 以下のような技術データで解析を実施
    • 画像
    • スペクトル・データ
    • DNA/RNA/タンパク質シーケンス
    • 化学
    • テキスト
    • ストリーミング(IoT/IoE)
    • 財務
    • 地質学/位置データ

強力な機械学習および予測分析が誰でも使えるように

  • 以下を含む、30 を超える教師付きおよび教師なし機械学習アルゴリズムで、モデル構築を自動化
    • ランダム・フォレスト、XGBoost、ニューラル・ネットワーク、線形回帰、サポート・ベクター・マシン、主成分分析(PCA)、遺伝的関数近似(GFA)
  • ディープ・ラーニング・モデルを適用、Python、R、Perl などのカスタム・スクリプトをプロトコルに直接接続
  • モデルのパフォーマンスを検証し、さまざまなアプローチと並べて比較
  • トレーニング済みモデルを共有して開発を合理化
導入

データ・サイエンスと開発チームの影響力を最大化

  • プロトコルをウェブ・サービス、API として導入、またはビルトイン・ウェブ・インターフェース(ウェブ・ポート)に導入
  • 主要ステークホルダー向けにインタラクティブなチャートおよび視覚情報を作成して組み合わせる
    • HTML 5 に完全準拠
    • グラフには散布図、折れ線グラフ、棒グラフ、ヒストグラム、極座標プロットを用意
    • 並べ替え、検索などが可能なインタラクティブなテーブル

科学専用のソリューション

科学およびエンジニアリング分野にはその専門分野固有の課題があり、解決するには同様に固有の能力が要求されます。ケモインフォマティクスからシーケンス解析および製剤設計、ドキュメントおよびテキスト検索まで、Pipeline Pilot にはすぐに使える多彩な機能が備わっています。弊社の科学知識を以下でご確認ください。