Calibration of an electrochemical sensor to generate an embedding in the embedding space.
Patent Information
- Authority / Receiving Office
- JP · JP
- Patent Type
- Patents
- Current Assignee / Owner
- OSMO LABS PBC
- Filing Date
- 2022-05-04
- Publication Date
- 2026-06-15
AI Technical Summary
【0014】 本開示の様々な実施形態のこれら及び他の特徴、態様及び利点は、以下の説明及び添付の請求項を参照すると、よりよく理解される。この明細書に組み込まれ、この明細書の一部を構成する添付の図面は、本開示の例示的な実施形態を示し、この説明と併せて、関連する原理を説明するよう機能する。 本発明は、例えば、以下の項目を提供する。 (項目1) コンピューティングシステムであって、 環境の1つ以上の化合物の存在を示す電気信号を生成するように構成されたセンサ、 前記電気信号を受信して処理し、埋め込み空間に埋め込みを生成するようにトレーニングされる、機械学習済モデルであって、 前記機械学習済モデルは、複数のトレーニングの例を含むトレーニングデータセットを使用してトレーニングされ、各トレーニングの例は、1つ以上のトレーニング用化合物にさらされたときに1つまたは複数のテストセンサによって生成される電気信号のセットに適用されるグラウンドトゥルース特性ラベルを含み、各グラウンドトゥルース特性ラベルは、前記1つ以上のトレーニング用化合物の特性を記述する、前記機械学習済モデル、 1つまたは複数のプロセッサ、及び 前記1つまたは複数のプロセッサによって実行されるときに、前記コンピューティングシステムに動作を実行させる命令をまとめて格納する、1つまたは複数の非一時的なコンピュータ可読媒体を含み、前記動作は、 前記センサによって、前記環境の特定の化合物の存在を示すセンサデータを生成すること、及び 前記1つまたは複数のプロセッサによって、前記機械学習済モデルを用いて前記センサデータを処理して、前記埋め込み空間に埋め込み出力を生成すること、 を含む、前記コンピューティングシステム。 (項目2) 前記埋め込み出力に基づいてタスクを実行することをさらに含む、いずれかの先行項目に記載のコンピューティングシステム。 (項目3) 前記タスクが、前記埋め込み出力に基づいて感覚特性予測を提供することを含む、いずれかの先行項目に記載のコンピューティングシステム。 (項目4) 前記タスクが、前記埋め込み出力に基づいて嗅覚特性予測を提供することを含む、いずれかの先行項目に記載のコンピュータシステム。 (項目5) 前記タスクは、前記埋め込み出力に少なくとも部分的に基づいて疾患の状態を特定することである、いずれかの先行項目に記載のコンピューティングシステム。 (項目6) 前記タスクは、前記埋め込み出力に少なくとも部分的に基づいて悪臭の状態を判定することである、いずれかの先行項目に記載のコンピューティングシステム。 (項目7) 前記タスクは、前記埋め込み出力に少なくとも部分的に基づいて腐敗が発生したかどうかを判定することである、いずれかの先行項目に記載のコンピューティングシステム。 (項目8) 前記タスクは、人間が入力したラベルを表示用に提示することを含み、前記人間が入力したラベルは、前記埋め込み空間の前記埋め込み出力との関連付けによって判定される、いずれかの先行項目に記載のコンピューティングシステム。 (項目9) 前記人間が入力したラベルは、特定の食品の名前を記述するものである、項目8に記載のコンピューティングシステム。 (項目10) 前記機械学習済モデルは、グラフニューラルネットワークと共同でトレーニングされ、トレーニングは、前記機械学習済モデルと前記グラフニューラルネットワークを共同でトレーニングして、前記埋め込み空間内部で単一の結合された出力を生成することを含む、いずれかの先行項目に記載のコンピューティングシステム。 (項目11) 前記グラフニューラルネットワークは、前記特定の化合物のグラフベースの表現を入力として受け取り、前記埋め込み空間のそれぞれの埋め込みを出力するようにトレーニングされる、項目10に記載のコンピューティングシステム。 (項目12) 前記機械学習済モデルは、 電気信号トレーニングデータ及びそれぞれのトレーニングラベルを含む化合物トレーニングの例を取得することであって、前記電気信号トレーニングデータ及び前記それぞれのトレーニングラベルは特定のトレーニング用化合物を記述するものである、前記取得すること、 前記機械学習済モデルを用いて前記電気信号トレーニングデータを処理して、化合物の埋め込み出力を生成すること、 分類モデルを用いて前記化合物の埋め込み出力を処理して、化合物ラベルを判定すること、 前記化合物ラベルと前記それぞれのトレーニングラベルとの間の差を評価する損失関数を評価すること、及び 前記損失関数に少なくとも部分的に基づいて、前記機械学習済モデルの1つまたは複数のパラメータを調整すること、によりトレーニングされている、いずれかの先行項目に記載のコンピューティングシステム。 (項目13) 前記機械学習済モデルは、教師あり学習によってトレーニングされている、いずれかの先行項目に記載のコンピューティングシステム。 (項目14) 前記センサデータは、電圧または電流のうちの少なくとも1つを記述する、いずれかの先行項目に記載のコンピューティングシステム。 (項目15) 前記機械学習済モデルは、トランスフォーマモデルを含む、いずれかの先行項目に記載のコンピューティングシステム。 (項目16) 前記埋め込み出力を格納することをさらに含む、いずれかの先行項目に記載のコンピューティングシステム。 (項目17) 前記センサデータは、1つ以上の電気信号の電圧または電流の一方または両方の振幅を記述する、いずれかの先行項目に記載のコンピューティングシステム。 (項目18) 前記1つまたは複数のプロセッサによって、前記機械学習済モデルを用いて前記センサデータを処理して、前記埋め込み空間に前記埋め込み出力を生成することは、前記センサデータを固定の長さのベクトル表現に圧縮することを含む、いずれかの先行項目に記載のコンピューティングシステム。 (項目19) コンピュータ実装方法であって、 1つまたは複数のプロセッサを備えるコンピューティングシステムによって、1つまたは複数のセンサでセンサデータを取得することであって、前記センサデータは、環境の1つまたは複数の化合物の存在によって生成される電気信号を記述する、前記取得すること、 前記コンピューティングシステムにより、機械学習済モデルを用いて前記センサデータを処理し、埋め込み空間に埋め込み出力を生成することであって、前記機械学習済モデルは、電気信号を記述するデータを受信して処理し、前記埋め込み空間に埋め込みを生成するようトレーニングされる、前記生成すること、 前記コンピューティングシステムによって、前記埋め込み空間の前記埋め込み出力に関連付けられた1つまたは複数のラベルを判定すること、及び 前記コンピューティングシステムによって、表示用の前記1つまたは複数のラベルを提示すること、 を含む、前記方法。 (項目20) 1つまたは複数のプロセッサによって実行されるときに、コンピューティングシステムに動作を実行させる命令をまとめて格納する、1つまたは複数の非一時的なコンピュータ可読媒体であって、前記動作は、 1つまたは複数のセンサでセンサデータを取得することであって、前記センサデータは、環境の1つまたは複数の化合物の存在によって生成される電気信号を記述する、前記取得すること、 機械学習済モデルを用いて前記センサデータを処理し、埋め込み空間に埋め込み出力を生成することであって、前記機械学習済モデルは、電気信号を記述するデータを受信して処理し、前記埋め込み空間に埋め込みを生成するようにトレーニングされる、前記生成すること、 複数の格納された感覚特性データセットを取得することであって、前記複数の格納された感覚特性データセットは、前記それぞれの格納された埋め込みに関連付けられたそれぞれの感覚特性データセットと対になった、前記埋め込み空間の格納された埋め込みを含む、前記取得すること、 前記埋め込み空間の前記埋め込み出力及び前記複数の格納された感覚特性データセットに基づいて1つまたは複数の感覚特性を判定すること、及び 表示用に前記1つまたは複数の感覚特性を提示すること、 を含む、1つまたは複数の非一時的なコンピュータ可読媒体。
Smart Images

Figure 0007874112000001 
Figure 0007874112000002 
Figure 0007874112000003
Abstract
Claims
[Claim 1] A computing system, A sensor configured to generate an electrical signal indicating the presence of one or more compounds in the environment. A machine learning model that receives and processes the aforementioned electrical signals and is trained to generate embeddings in the embedding space, The machine learning model is trained using a training dataset that includes multiple training examples, each training example including a ground truth characteristic label applied to a set of electrical signals generated by one or more test sensors when exposed to one or more training compounds, and each ground truth characteristic label describes the properties of the one or more training compounds, the machine learning model, One or more processors, and The system includes one or more non-temporary computer-readable media that store together instructions causing the computing system to perform an operation when executed by the one or more processors, and the operation is The sensor generates sensor data indicating the presence of a specific compound in the environment, and The one or more processors process the sensor data using the machine learning model to generate an embedded output in the embedded space. A computing system that includes this. [Claim 2] The computing system according to claim 1, further comprising performing a task based on the embedded output. [Claim 3] The computing system according to claim 2, wherein the task includes providing a prediction of sensory characteristics based on the embedded output. [Claim 4] The computer system according to claim 2, wherein the task includes providing an olfactory characteristic prediction based on the embedded output. [Claim 5] The computing system according to claim 2, wherein the task is to identify a disease state based at least in part on the embedded output. [Claim 6] The computing system according to claim 2, wherein the task is to determine the state of an odor based at least in part on the embedded output. [Claim 7] The computing system according to claim 2, wherein the task is to determine whether decay has occurred based at least partially on the embedded output. [Claim 8] The computing system according to claim 2, wherein the task includes presenting a label entered by a human for display, the label entered by a human being determined by association with the embedded output of the embedded space. [Claim 9] The computing system according to claim 8, wherein the label entered by the human describes the name of a specific food item. [Claim 10] The computing system according to claim 1, wherein the machine learning model is trained in conjunction with a graph neural network, and the training comprises training the machine learning model and the graph neural network together to produce a single combined output within the embedding space. [Claim 11] The computing system according to claim 10, wherein the graph neural network is trained to take a graph-based representation of the particular compound as input and to output each of the embeddings in the embedding space. [Claim 12] The aforementioned machine learning model, Obtaining an example of compound training including electrical signal training data and respective training labels, wherein the electrical signal training data and respective training labels describe a specific training compound. The process involves using the aforementioned machine learning model to process the electrical signal training data and generate a compound embedding output. The embedded output of the compound is processed using a classification model to determine the compound label. Evaluate the loss function that evaluates the difference between the compound label and each of the training labels, and The computing system according to claim 1, which is trained by adjusting one or more parameters of the machine learning model based at least in part on the loss function. [Claim 13] The computing system according to claim 1, wherein the machine learning model is trained by supervised learning. [Claim 14] The computing system according to claim 1, wherein the sensor data describes at least one of voltage or current. [Claim 15] The computing system according to claim 1, wherein the machine learning model includes a transformer model. [Claim 16] The computing system according to claim 1, further comprising storing the embedded output. [Claim 17] The computing system according to claim 1, wherein the sensor data describes the amplitude of one or both of the voltages and / or currents of one or more electrical signals. [Claim 18] The computing system according to claim 1, wherein processing the sensor data using the machine learning model by one or more processors to generate the embedded output in the embedded space includes compressing the sensor data into a vector representation of a fixed length. [Claim 19] A computer implementation method, A computing system comprising one or more processors acquires sensor data from one or more sensors, wherein the sensor data describes an electrical signal generated by the presence of one or more compounds in the environment. The computing system processes the sensor data using a machine learning model and generates an embedded output in the embedding space, wherein the machine learning model is trained to receive and process data describing electrical signals and generate embeddings in the embedding space. The computing system determines one or more labels associated with the embedded output of the embedded space, and The computing system presents one or more labels for display. Methods that include... [Claim 20] One or more non-temporary computer-readable media that store a set of instructions causing a computing system to perform an action when executed by one or more processors, wherein the action is: The method involves acquiring sensor data using one or more sensors, wherein the sensor data describes an electrical signal generated by the presence of one or more compounds in the environment. The process involves processing the sensor data using a machine learning model and generating an embedded output in the embedded space, wherein the machine learning model is trained to receive and process data describing electrical signals and generate an embedded in the embedded space. The method involves obtaining multiple stored sensory characteristic datasets, wherein each of the multiple stored sensory characteristic datasets includes a stored embedding in the embedding space paired with each of the sensory characteristic datasets, and each of the sensory characteristic datasets is associated with each of the stored embeddings. Determining one or more sensory characteristics based on the embedded output of the embedded space and the plurality of stored sensory characteristic datasets, and To present one or more of the aforementioned sensory characteristics for display purposes, One or more non-temporary computer-readable media, including [the specified text].