TextEmbedder

คลาสสุดท้ายสาธารณะ TextEmbedder

ดำเนินการดึงข้อมูลการฝังในข้อความ

API นี้ควรเป็นโมเดล TFLite ที่มีข้อมูลเมตาของโมเดล TFLite (ไม่บังคับ)

ต้องมีข้อมูลเมตาสำหรับโมเดลที่มี Tensor อินพุต int32 เนื่องจากมีหน่วยกระบวนการอินพุตสำหรับ Tokenizer ของโมเดล ไม่จำเป็นต้องมีข้อมูลเมตาสำหรับโมเดลที่มี Tensor อินพุตสตริง

  • Tensor อินพุต
    • Tensor อินพุต 3 รายการ (kTfLiteInt32) ของรูปร่าง [batch_size x bert_max_seq_len] ที่แสดงถึงรหัสอินพุต รหัสมาสก์ และรหัสกลุ่ม ลายเซ็นของอินพุตนี้ต้องมีหน่วยประมวลผล Bert Tokenizer ในข้อมูลเมตาของโมเดล
    • หรือ Tensor อินพุต (kTfLiteInt32) ของรูปร่าง [batch_size x max_seq_len] ที่แทนรหัสอินพุต ลายเซ็นอินพุตนี้ต้องมีหน่วยประมวลผล Regex Tokenizer ในข้อมูลเมตาของโมเดล
    • หรือ Tensor อินพุต (kTfLiteString) ที่ไม่มีรูปร่างหรือมีรูปร่าง [1] ที่มีสตริงอินพุต
  • Tensor เอาต์พุตอย่างน้อย 1 รายการ (kTfLiteFloat32/kTfLiteUint8) ที่มีรูปร่าง [1 x N] โดยที่ N คือจำนวนมิติข้อมูลในการฝังที่สร้างขึ้น

ชั้นเรียนที่ซ้อนกัน

คลาส TextEmbedder.TextEmbedderOptions ตัวเลือกในการตั้งค่าTextEmbedder 

วิธีการสาธารณะ

void
close()
ปิดและล้าง TextEmbedder
static 2 เท่า
cosineSimilarity(การฝัง u, การฝัง v)
ฟังก์ชันยูทิลิตีเพื่อคำนวณความคล้ายคลึงกันของโคไซน์ระหว่างออบเจ็กต์ Embedding 2 รายการ
static TextEmbedder
createFromFile(บริบทบริบท, String modelPath)
สร้างอินสแตนซ์ TextEmbedder จากไฟล์โมเดลและ TextEmbedder.TextEmbedderOptions เริ่มต้น
static TextEmbedder
createFromFile(บริบทบริบท, ไฟล์ modelFile)
สร้างอินสแตนซ์ TextEmbedder จากไฟล์โมเดลและ TextEmbedder.TextEmbedderOptions เริ่มต้น
static TextEmbedder
createFromOptions(บริบทของบริบท, ตัวเลือก TextEmbedder.TextEmbedderOptions)
สร้างอินสแตนซ์ TextEmbedder จาก TextEmbedder.TextEmbedderOptions
TextEmbedderResult
embed(ข้อความอินพุต String)
ดำเนินการดึงข้อมูลการฝังในข้อความอินพุต

วิธีการที่รับช่วงมา

วิธีการสาธารณะ

สาธารณะ โมฆะ ปิด ()

ปิดและล้าง TextEmbedder

สาธารณะ คงที่ Double cosineSimilarity (การฝัง u, การฝัง v)

ฟังก์ชันยูทิลิตีเพื่อคำนวณความคล้ายคลึงกันของโคไซน์ระหว่างออบเจ็กต์ Embedding 2 รายการ

พารามิเตอร์
u
v
การขว้าง
IllegalArgumentException การฝังเป็นคนละชนิดกัน (แบบลอยกับวัดปริมาณ) มีขนาดต่างกัน หรือมี L2-norm เป็น 0

สาธารณะ static TextEmbedder createFromFile (บริบทบริบท, String modelPath)

สร้างอินสแตนซ์ TextEmbedder จากไฟล์โมเดลและ TextEmbedder.TextEmbedderOptions เริ่มต้น

พารามิเตอร์
บริบท Android ERROR(/Context)
modelPath เส้นทางไปยังโมเดลข้อความที่มีข้อมูลเมตาในเนื้อหา
การขว้าง
หากเกิดข้อผิดพลาดระหว่างการสร้าง TextEmbedder

สาธารณะ static TextEmbedder createFromFile (บริบทบริบท, ไฟล์ modelFile)

สร้างอินสแตนซ์ TextEmbedder จากไฟล์โมเดลและ TextEmbedder.TextEmbedderOptions เริ่มต้น

พารามิเตอร์
บริบท Android ERROR(/Context)
modelFile อินสแตนซ์ของโมเดลข้อความ File
การขว้าง
IOException หากเกิดข้อผิดพลาด I/O เมื่อเปิดไฟล์โมเดล tflite
หากเกิดข้อผิดพลาดระหว่างการสร้าง TextEmbedder

สาธารณะ static TextEmbedder createFromOptions (บริบทบริบท, ตัวเลือก TextEmbedder.TextEmbedderOptions)

สร้างอินสแตนซ์ TextEmbedder จาก TextEmbedder.TextEmbedderOptions

พารามิเตอร์
บริบท Android ERROR(/Context)
ตัวเลือก อินสแตนซ์ TextEmbedder.TextEmbedderOptions
การขว้าง
หากเกิดข้อผิดพลาดระหว่างการสร้าง TextEmbedder

สาธารณะ TextEmbedderResult embed (String InputText)

ดำเนินการดึงข้อมูลการฝังในข้อความอินพุต

พารามิเตอร์
inputText Stringสำหรับการประมวลผล