ブログに戻る

Node-CSVを使用したNode.jsでのCSV管理

Node-CSVを使用したNode.jsでのCSV管理

A CSV ファイルは、データを表形式で保存するプレーンテキストファイルです。ほとんどの場合、CSVファイルは区切り文字としてカンマ(,)を使用するため、CSV(Comma Separated Values)という名前が付けられています。CSVは、任意のテキストエディタ、スプレッドシートアプリ、その他の専用ツールで開くことができるため、データの互換性が懸念される状況で使用されます。実際、多くのプログラミング言語がCSVの組み込みサポートを提供しています。

このガイドでは、サンプルの Node.js アプリケーションでCSVを使用する方法について学びます。

Node.jsにおけるCSV

Node.jsは、オープンソースでクロスプラットフォームのJavaScriptランタイム環境です。インターネット上の無数のWebサービスを支える、最も人気のあるバックエンドの1つとなっています。NetflixやUberのような大企業でさえ、自社サービスを動かすためにNode.jsを使用しています。

Node.jsには、プロジェクトに機能を追加するためにデプロイできる多数のモジュールも用意されています。CSVに関しては、使用できる多くのモジュールがあります。例えば、node-csv, fast-csv、および papaparse などです。

ガイドのタイトルが示すように、 node-csv を使用して、Node.jsストリームでCSVファイルを読み込みます。また、解析されたデータの操作(例えば、データを SQLite データベースに転送するなど)についても実演します。

前提条件

ステップ 1 – 必要なソフトウェアのインストール

このガイドでは、Ubuntu 22.04 LTSを実行する軽量サーバーを作成しました(SSH経由で接続):

次に、そこにNode.jsとSQLiteをインストールします。

  • Node.js LTSのインストール

Node.jsは公式のUbuntuパッケージリポジトリから直接入手できます。ただし、最新バージョンではありません。そのため、最新のNode.jsパッケージを取得するためにサードパーティのリポジトリ(Nodesource)に依存することになります。

Node.js LTSのリポジトリを追加します:

次に、Node.js LTSをインストールします:

  • SQLiteのインストール

SQLiteはUbuntuパッケージリポジトリから直接インストールします。次のコマンドを実行します:

ステップ 2 – プロジェクトディレクトリの設定

このセクションでは、プロジェクト専用のディレクトリを用意します。ここには、追加のモジュールとともにすべてのプロジェクトファイルが保存されます。

新しいディレクトリを作成します:

ディレクトリに移動します:

次に、以下のコマンドを実行して、ディレクトリを npm プロジェクトとして宣言します:

プロジェクトフォルダが初期化されたら、必要なパッケージとモジュールのインストールを開始できます。まず、 node-csv:

node-csvモジュールは、実際には他のいくつかのモジュールのコレクションです:csv-generate, csv-parse(CSVファイルの解析)、csv-stringify(CSVへのデータ書き込み)、および stream-transform.

次に、SQLiteと通信するためのモジュールが必要です。次のコマンドで node-sqlite3 モジュールをインストールします:

プロジェクトに必要なコンポーネントはCSVファイルです。デモンストレーションの目的で、ニュージーランドの移民CSVファイルを使用します:

ファイルの内容を簡単に見てみましょう:

ここでは、

  • 最初の行は列名を表しています。

  • 続く行には、これらのフィールドの値が含まれています。

  • 各行は改行(\n)で区切られています。

  • 各データポイントはカンマ(,)で区切られています。

ただし、CSVの区切り文字はカンマに限定されません。その他の一般的な区切り文字には、コロン(:)、セミコロン(;)、タブ(\td)などがあります。

ステップ 3 – CSVの読み込み

このセクションでは、CSVファイルからデータを読み込んで解析するサンプルプログラムの実装方法を説明します。

新しいJavaScriptファイルを作成します:

お好みのテキストエディタでファイルを開きます:

まず、次のモジュールをインポートします: fs および csv-parse モジュール:

ここでは、

  • まず、 fs 変数には、モジュールをインポートする際にNode.jsの fs オブジェクトが割り当てられます。これは require() メソッドによって返されるものです。

  • 次に、 require() メソッドによって返されたオブジェクトから、分割代入構文を使用して parse 変数に抽出されます。.

次に、CSVファイルを読み込むコードを追加します:

ここでは、

  • fsモジュールから createReadStream() を呼び出し、読み込みたいCSVファイルを引数として渡しています。これにより、大きなファイルが小さなチャンクに分割され、読み取り可能なストリームが作成されます。

  • ストリームを作成した後、 pipe() メソッドがストリームデータのチャンクを別のストリームに転送します。この新しいストリームは、 parse() メソッドを csv-モジュールから呼び出すことで作成されます。.

  • The csv-モジュール は、データチャンクを受け取り、それを別の形式に変換する読み書き可能な変換(Transform)ストリームを展開します。

  • The parse() メソッドはプロパティを持つオブジェクトを受け取ります。このオブジェクトは、解析されたデータをさらに処理します。ここでは、オブジェクトは次のプロパティを受け取っています:

    • delimiter:値を区切るための区切り文字。今回の対象CSVの場合はカンマ(,)です。

    • from_line:パーサーが解析を開始する行番号。値に2を指定すると、パーサーは1行目をスキップして2行目から開始します。この設定により、列名が解析データに組み込まれるのを防ぎます。

次に、Node.jsの on() メソッドを使用して、ストリーミングイベントをアタッチします:

ここでは、

  • ストリーミングイベントを使用すると、特定のイベントが発生したときに、メソッドがデータのチャンクを処理(消費)できるようになります。

  • When data parsed by parse() メソッドによって解析されたデータが処理可能になると、 data イベントがトリガーされます。

  • データにアクセスするために、 on() メソッドに、パラメータ row を受け取るコールバックを渡しています。

  • row パラメータは、配列形式のデータのチャンク(解析結果)です。

  • 最後に、データは console.log().

を使用してコンソールに出力されます。プログラムを完成させるために、エラーを処理し、CSVファイル内のすべてのデータが処理されたときに完了メッセージを出力する追加のストリームイベントを追加します。コードを以下のように更新してください:

ここでは、

  • end イベントは、CSV ファイル内のすべてのデータが消費されたときに発生します。これにより、次のメソッドが呼び出されます。 console.log() メソッドが呼び出され、成功メッセージが出力されます。

  • error イベントは、CSV データの解析中にエラーが発生したときに発生します。これにより、次のメソッドが呼び出されます。 console.log() メソッドが呼び出され、エラーメッセージが出力されます。

最終的なコードは次のようになります。

ファイルを保存してエディタを閉じます。これでプログラムを実行する準備が整いました。Node.js を使用して実行します。

出力は次のようになります。

データが消費、変換され、コンソールに出力されていることに注意してください。これは継続的なプロセスであるため、出力を一度にすべて表示するのではなく、データがダウンロードされているかのように表示されます。

ステップ 4 – CSV データをデータベースに転送する

ここまでは、次のツールを使用して CSV ファイルを解析する方法を学びました。 node-csv。このセクションでは、解析されたデータをデータベース(SQLite)に転送する方法を説明します。

データベースとやり取りするための新しい JavaScript ファイルを作成します。

次に、テキストエディタでファイルを開きます。

次のコードからプログラムを開始します。

ここでは、

  • 1行目で、次のモジュールをインポートしています。 fs モジュール。

  • 3行目で、変数 filepath には SQLite データベースのパスが含まれています。

  • 現時点では、データベースはまだ存在していません。ただし、次のツールを使用する際には必要になります。 node-sqlite3.

次に、以下の行を追加して SQLite データベースへの接続を確立します。

ここでは、

  • メソッド connectoToDatabase()はデータベースへの接続を確立します。

  • Within connectToDatabase()内では、 existsSync()メソッドをif文の中で呼び出しています。このif文は、指定された場所にデータベースが存在するかどうかを確認します。

    • 条件の評価結果が trueの場合、 Database()クラスが、 node-sqlite3モジュールによってインスタンス化されます。接続が確立されると、関数はオブジェクトを返して終了します。

    • 条件の評価結果が false(データベースが存在しない)場合、実行はelseブロックにジャンプします。そこでは、 Database()クラスが、データベースファイルへのパスとコールバックの2つの引数で初期化されます。

基本的には、データベースが存在しない場合は作成されます。ただし、作成プロセス中にエラーが発生した場合は、 errorオブジェクトを設定し、エラーメッセージを出力します。

次に、データベースが存在しない場合にテーブルを作成するコードを紹介します。

ここでは、

  • The connectToDatabase()は、 createTable()関数を呼び出し、この関数は dbに格納されているオブジェクトを引数として受け取ります。

  • の外側で、connectToDatabase()、私たちは createTable()メソッドを定義しました。このメソッドは、接続オブジェクト dbをパラメータとして受け取ります。

  • The exec()メソッド( db上)は、SQLステートメントを引数として受け取ります。このSQLステートメント内で、 migrationテーブルの作成を定義しています。このテーブルには7つのカラムがあり、各カラムは migration_data.csvファイルの列見出しに対応しています。

  • 最後に、 connectToDatabaseを呼び出しています。() メソッドを使用し、返された接続オブジェクトをエクスポートして、他のファイルで使用できるようにします。

ファイルを保存してエディタを閉じます。

次に、解析されたデータをデータベースに挿入するための別のプログラムを作成します。

以下のコードを に入力します。insert_data.js:

ここでは、

  • We are storing the connection object obtained from csv-to-sqlite3.js から取得した接続オブジェクトを、変数 db に格納しています。.

  • data イベントコールバック(fs モジュールストリームにアタッチされています)の内部で、接続オブジェクトの serialize() メソッドを呼び出しています。これにより、1つの SQL ステートメントの実行が完了してから次のステートメントが開始されるようになり、データベースの競合状態(システムが競合する操作を同時に実行すること)を防ぐことができます。

  • The serialize() メソッドは3つの引数を受け取ります:

    • 最初の引数は SQL ステートメントです。

    • 2番目の引数は配列です。

    • 3番目の引数は、データがデータベースに正常に挿入されたとき、または挿入に失敗したときに実行されるコールバックです。

プログラムを実行する準備が整いました。Node.js を使用して insert_data.js を実行します:

システムのパフォーマンスによっては、処理が完了するまでに時間がかかる場合があります。ただし、完了すると、出力は次のようになります。

ステップ 5 – CSV へのデータの書き込み

前回のセクションを終えると、 migration_data.csv から解析したすべてのレコードを含むデータベースが作成されています。このセクションでは、データベースからデータを読み取り、別の CSV ファイルに書き込みます。

プログラムを保存するための新しい JavaScript ファイルを作成します。

まず、次の行を追加して、 fscsv-stringify、および csv-to-sqlite3.js からのデータベース接続オブジェクトをインポートします。:

次に、書き込み先のCSVファイル名を含む変数と、書き込み可能なストリームを追加します:

ここで、

  • The createWriteStream() メソッドは、書き込み先のファイル名を引数として受け取ります。ファイル名は saved_from_db.csv とします。.

  • The column 変数は、CSVデータのヘッダーのすべての名前を含む配列を格納します。

次に、データベースからデータを読み込み、 saved_from_db.csv に書き込むための以下のコードを追加します。:

ここで、

  • ここでは、 stringify() メソッドをオブジェクトを引数として呼び出しています。これにより、オブジェクトからCSV形式にデータを変換する変換ストリーム(Transform stream)が得られます。 stringify() に渡されるオブジェクトには、次の2つのプロパティがあります。

    • header: Boolean値を受け入れます。値が true の場合、ヘッダーが生成されます。

    • columns: headertrue の場合に、CSVファイルの最初の行に書き込まれる列名を含む配列を受け入れます。.

  • The each() メソッド( csv-to-sqlite3 接続オブジェクトのメソッド)は、SQLステートメント(データベースからのデータの読み取り)とコールバック(成功/エラーの処理)の2つの引数を指定して呼び出されます。

  • Upon each iteration of each(), の各反復において、pipe()stringifier ストリームから)は、書き込み可能ストリーム writableStream にデータをチャンク単位で送信し始めます。その後、データの各チャンクが saved_from_db.csv に書き込まれます。.

  • すべてのデータがCSVファイルに書き込まれると、コンソール画面に成功メッセージが表示されます。

最終的なコードは次のようになります:

ファイルを保存してエディタを閉じます。これで、Node.jsを使用してプログラムを実行できます。

データが正常にエクスポートされたか確認するには、次の内容を確認してください。 saved_from_db.csv:

まとめ

このガイドでは、node-csvおよびnode-sqlite3モジュールを使用して、Node.jsでCSVファイルを操作する方法を説明しました。CSVからのデータの解析、SQLiteデータベースへのデータの挿入、新しいCSVファイルへのデータの書き込みなど、さまざまなタスクを実行するための複数のプログラムを作成しました。

このガイドでは、次の機能のほんの一部のみを紹介しています。 node-csv モジュール。すべての機能の詳細については、以下を参照してください。CSV Project。node-sqlite3の詳細については、以下を参照してください。GitHubの公式ドキュメント。また、言及する価値のあるもう1つのモジュールは、event-stream で、ストリームの操作を簡素化します。

Node.jsプロジェクトをさらに発展させることに興味がありますか?ぜひチェックしていただきたいNode.jsのチュートリアルをいくつかご紹介します。

ハッピーコンピューティング!

author

Preslav Dobrev

著者 · CloudSigma

Preslav DobrevはCloudSigmaのクリエイティブデザイナーであり、従来型および革新的なマーケティングチャネルを活用した一貫性のあるビジネスアイデンティティに注力しています。彼は芸術的なビジョンと戦略的マーケティングを融合させ、インパクトのあるブランドナラティブを生み出すことに長けています。

コメント

コメントはまだありません。最初のコメントを投稿しましょう。