নির্দিষ্ট ধরনের কাস্ট কাজ করে এবং করতে দেয়। BIGINT আবিষ্কার করুন (ধাপ ১ – ২) -১ পায়, কারণ এটি কিছুটা প্রত্যাশিত। Sphinx সর্বত্র যে অপরিহার্য সংখ্যাসূচক প্রকারগুলি (এবং এক্সপ্রেশন) ব্যবহার করে তা হল UINT (u32), BIGINT ( goldbet আসল অ্যাপ i64), এবং FLOAT (f32)। সবচেয়ে বড় দ্বন্দ্বের প্রকারের সাথে গবেষণা ঘটে। সম্ভবত প্রায়শই, একটি ফর্ম খুব পাতলা! গাণিতিক অপারেটরগুলি আসলে সমস্ত সংখ্যাসূচক আর্গুমেন্ট মডেলগুলির জন্য সমর্থিত, এবং সেগুলি নীচে রয়েছে। আপনার যদি বিকল্প হিসাবে BIGINT-এ রূপান্তরের প্রয়োজন হয়, আপনি তা স্পষ্টভাবে উল্লেখ করতে পারেন। সুতরাং পদগুলি চেইন, JSON, অ্যারে, সেট ইত্যাদির সাথে কাজ করতে পারে।
অনুসন্ধানের কেন্দ্রবিন্দুতে
- একদম নতুন টাইমআউট অপশনটি এখন পাওয়া যাচ্ছে এবং ডিফল্ট হিসেবে আপনি ১০ সেকেন্ড সেট করতে পারবেন।
- স্ফিংক্সকাইন্ডা ত্রুটিহীন উপাদানগুলো থেকে পাওয়া প্রায় যেকোনো কিছু দিয়ে তৈরি, অন্তত আংশিকভাবে “উদ্ধার করা” প্রভাব সেটটি ফিরে পেতে আপ্রাণ চেষ্টা করেছিল।
- আমরা আপাতত শুধু FLOATN-কে সাহায্য করছি, তবে পরবর্তীতে আরও প্রকারভেদ যুক্ত করব।
- এটি ক্যারেক্টারসেট_ডাইনিং টেবিলের উপর ভিত্তি করে তৈরি প্রচলিত টোকেনাইজেশন পদ্ধতিতে একটি সুবিধাজনক সংযোজন হতে পারে।
- বিস্তারিত আলোচনার জন্য, “ডেটাডির নিয়ে মজা” অংশটি দেখুন।
সংস্করণ ২.০.১-বিটা-তে তৈরি 'ইনফর্ম ইউ ডাইনিং টেবিলস রিপোর্ট' তাদের সংস্করণ ব্যবহার করে ইতিমধ্যে সক্রিয় সমস্ত স্পাইডারকে তালিকাভুক্ত করে। সংস্করণ ২.২.২-বিটা থেকে এটি অনুসন্ধান থেকে প্রতিটি কীওয়ার্ডের অবস্থানও আউটপুট করে এবং যদি লেম্যাটাইজার ব্যবহার করা হয়ে থাকে তবে আপনি সমস্ত ধরণের টোকেনাইজড টার্মও দেখতে পাবেন। সংস্করণ ১.১০-বিটা-তে আনা 'রিমুভ রিপোর্ট'টি আরটি (RT) স্পাইডার ধারণ করার জন্য উপলব্ধ এবং এটি এজেন্ট হিসাবে শুধুমাত্র আরটি স্পাইডার ধারণ করে। এটি আইডি-র উপর ভিত্তি করে একটি বিদ্যমান তালিকা থেকে নির্ধারিত সারি (ডকুমেন্ট) মুছে ফেলে। সংস্করণ ২.১০-বিটা-তে, আপনি ঐচ্ছিক 'ইনক্লুডিং' টার্ম ব্যবহার করতে পারেন। এটি আপনাকে একটি প্যাটার্নের সাথে মেলে এমন শুধুমাত্র সেই বিবরণগুলি খুঁজে পেতে সক্ষম করে। কনফিগারেশন ফাইল, sphinx.conf-এ, আপনি অনুসন্ধানের জন্য এক বা একাধিক স্পাইডার নির্দিষ্ট করেন।
global_idf নির্দেশিকা
ZONESPANLIST() একটি চমৎকার ZONESPAN এজেন্ট দ্বারা মেলানো স্প্যানগুলির একটি তালিকা একটি সাধারণ টেক্সট ফরম্যাটে আউটপুট করে। যখন কোনো যোগ্য “কোয়েরি” টার্ম থাকে না, তখন এটি স্বয়ংক্রিয়ভাবে একটি স্থির ০-তে রূপান্তরিত হয় (ওয়েব ব্রাউজার)। এটি প্রাথমিকভাবে SNIPPET() কলগুলির জন্য একটি চমৎকার সিনট্যাক্স হিসেবে ডিজাইন করা হয়েছিল, যাতে নতুন টার্মগুলো বারবার লোড না হয়, কিন্তু ML ট্রেনিং স্টাডি তৈরির সময়ও এটি সুবিধাজনক হতে পারে। (মনে রাখবেন, json.key-তে অ্যাক্সেস পেতে হলে আপনাকে `dos`-এর তালিকাটি সাইজ করতে হবে, কারণ এগুলো সেট! নিচের উদাহরণগুলো দেখুন।)
- আপনি dos.dos.1-beta টাইপ দিয়ে শুরু করেন, GEODIST() এর জন্য একটি ঐচ্ছিক পঞ্চম আর্গুমেন্টের প্রয়োজন হয় যা আপনাকে ইনপুট এবং প্রোডাক্টিভিটি ডিভাইসের মধ্যে অনায়াসে স্থানান্তর করতে এবং ব্যবহারের জন্য একেবারে নতুন নির্দিষ্ট জিওডিস্ট্যান্স অ্যালগরিদম বেছে নিতে সক্ষম করে।
- এর মধ্যে, নিম্নলিখিত দুটি কোয়েরি একই ডেটা ফাইলের সাথে খাপ খায়, কিন্তু পরেরটি স্পষ্টতই আরও সরল এবং গণনা করাও সহজতর।
- আপনি একটি বিকল্প শর্ত ব্যবহার করে নতুন বকেয়া পরিশোধ না করার নিয়মটি এড়িয়ে যেতে পারেন। এটি SphinxQL-এর Perform Directory স্টেটমেন্ট এবং একেবারে নতুন create_list কনফিগ ডিরেক্টিভ দ্বারা সমর্থিত।
- ব্যাচড ইউডিএফ-কে অবশ্যই সম্পূর্ণ নতুন ফলাফলের পরিসরটি অনেক যুক্তিসঙ্গত মানদণ্ড দিয়ে পূরণ করতে হবে, এমনকি যদি তারা ব্যাচের মাঝখানে একটি গুরুতর অপূরণীয় ভুলের কারণে ব্যর্থ হওয়ার সিদ্ধান্ত নেয়।
- সংযোগের জন্য ODBC DSN। বাধ্যতামূলক, কোনো নির্দিষ্ট মান নেই। এটি শুধুমাত্র ODBC-এর মূল ফর্মের সাথে সম্পর্কিত।

এখানে কয়েকটি বিষয় উল্লেখ করা হলো যা নিয়ে আলোচনা করা যেতে পারে। (বিশেষ দ্রষ্টব্য: নিচের তালিকাটি সর্বদা অসম্পূর্ণ এবং এলোমেলোভাবে সাজানো।) টেক্সট মেসেজ-বহির্ভূত বিষয়বস্তুর উপর ঐচ্ছিক অতিরিক্ত ইনডেক্সও উপলব্ধ আছে। আমাদের এক নম্বর এবং সর্বদা উপলব্ধ ডিরেক্টরিটি হলো টেক্সট ফিল্ডের জন্য ফুল-টেক্সট ডিরেক্টরি, যা ফুল-টেক্সট কোয়েরির জন্য প্রয়োজন।
পরিমাণযোগ্য ফলাফলের অনুভূতির কারণে এই বিষয়গুলো ডিফল্টরূপে সক্রিয় করা হয় না। এই কাউন্টারগুলো পরবর্তীতে GA লঞ্চের জন্য উপলব্ধ হতেও পারে বা নাও হতে পারে, এবং ইচ্ছাকৃতভাবে এখানে উল্লেখ করা হয়নি। এই বিষয়গুলো (সংক্ষেপে) ঠিক নীচে রিপোর্ট করা হয়েছে, এবং মূলত স্বাস্থ্য পরীক্ষা, পর্যবেক্ষণ ইত্যাদিতে ব্যবহার করা উচিত। 'রিপ্লিকা' সমস্ত প্রতিলিপিকৃত সূচকের নতুন প্রতিলিপি শীর্ষস্থান প্রদর্শন করে। শেষ এন্ট্রিটি স্পষ্টতই "মোট" এবং এটি প্রোফাইল করা সমস্ত সময়কালের নতুন পরিমাণ গণনা করে এবং সেই অনুযায়ী পরিবর্তন হয়। এখানে আপনার বর্তমান চরিত্রের বিবৃতির একটি সংক্ষিপ্ত বিবরণ দেওয়া হলো।
মেটাফোন ইমপ্লিমেন্টেশন ডাবল মেটাফোন ফর্মুলার উপর ভিত্তি করে তৈরি এবং এটি কী পাসওয়ার্ডকে ইনডেক্স করে। যদি ফাইলগুলো প্রকৃতপক্ষে ছোট হয় (যেমন, ১কেবি-এর নিচে), তবে একবারে একাধিক ফাইল নিয়ন্ত্রণ করলে ইনডেক্সিংয়ের গতি উল্লেখযোগ্যভাবে বাড়তে পারে। এটি সবচেয়ে পুরোনো rlp_chinese সেগমেন্টেশনের মতোই ফিচার প্রদান করে, তবে RLP-এর কারণে ডেটা প্রসেস করার আগে সেগুলোকে ব্যাচিং করার সুবিধা দেয়। এছাড়াও rlp_options, rlp_ecosystem এবং rlp_context অপশনগুলো দেখুন। এক ধরনের ব্যাচড RLP সেগমেন্টেশনও উপলব্ধ আছে (rlp_chinese_batched)। স্ফিংস আগত ডকুমেন্টগুলোর প্রতিটি টোকেনের শব্দভান্ডার শনাক্তকরণের জন্য কাজ করে।
প্রোডাকশনের উপর এর কোনো প্রভাব নেই বললেই চলে, তবে ডিবাগিংয়ের জন্য এটি খুবই দরকারি (অনুসন্ধানের ধরণ আলাদা করতে, উৎস ক্লায়েন্ট শনাক্ত করতে, বা অন্য যেকোনো কিছুর জন্য; এর সম্ভাবনা অসীম)। এ বিষয়ে আরও তথ্যের জন্য, “Distributed queryerrors” অপশনটি দেখুন। একমাত্র অন্য অপশনটি হলো lax_agent_problems, যার ডিফল্ট মান ০ (গুরুতর সমস্যা) এবং আপনি চাইলে এতে ফিরে যেতে পারেন, যদিও আমরা এটিতে ফিরে যাওয়ার জোরালো পরামর্শ দিই না। এর পাশাপাশি “Outbound (distributed)queries” অপশনটিও খুঁজুন।