Aplikabisnis

Hashdata
Cloud Data Platform
for Analytics and AI

Hashdata didirikan pada tahun 2016 dan merupakan perusahaan rintisan yang berfokus pada cloud data warehouse. Tim intinya sebagian besar terdiri dari senior cloud computing yang pakar di bidangnya, distributed databases dan big data dari perusahaan seperti Pivotal, Teradata, IBM, Yahoo!, Oracle, dan Huawei. 

Pengetahuan teknologi yang mendalam dan konsep produk berwawasan ke depan, perusahaan ini telah menerima pembiayaan dari lembaga investasi terkenal seperti Matrix Partners, Guoke Jiahe, dan Jinshajiang Venture Capital sejak awal berdirinya, dengan jumlah pembiayaan kumulatif lebih dari 10 juta USD. Hashdata memecahkan masalah data warehouse yang paling menantang bagi pelanggan terkemuka di industri penting yang terkait dengan bidang perekonomian nasional seperti keuangan, telekomunikasi, energi, dan transportasi: puluhan juta objek database, volume data 100+PB, ribuan data secara bersamaan aplikasi, Dan 100 juta+ kueri SQL kompleks setiap hari.

Penggunaan yang mudah dengan deploy cluster dalam 5 menit. Support teknologi PostgreSQL dan Greenplum serta tagihan berdasarkan penggunaan.

Pemisahan komputasi dan penyimpanan, membuat konfigurasi sumber daya komputasi lebih fleksibel. Menggunakan penyimpanan objek, menurunkan biaya penyimpanan

Shared-everything: cluster mana pun dapat mengakses data apapun. Data lake terpadu, berbagi data lengkap. Hilangkan sepenuhnya penyalinan dan redundansi data, dan datanya sangat real-time.

Product Features

Data storage layer

Bayar sesuai pemakaian, biaya penyimpanan dengan kapasitas unit yang rendah secara signifikan dapat mengurangi biaya penggunaan Cloud Data Warehouse berdasarkan penyimpanan object storage.
Selain itu, teknologi Data Warehouse HashData juga mendukung algoritma kompresi unik, yang selanjutnya dapat meningkatkan pemanfaatan ruang penyimpanan sebanyak 2 hingga 3 kali lipat. .

Metadata Service Layer

Metadata disimpan melalui database KV terdistribusi transaksional global.
Di atas database KV, kami telah membangun lapisan node layanan tanpa menyimpan untuk menerima permintaan akses metadata sistem dari lapisan komputasi. Pada saat yang sama, Pastikan ketersediaan data yang tinggi.

Computing resource layer

Pertukaran data melalui protokol transmisi data berkecepatan tinggi berdasarkan UDP, dan kueri dieksekusi secara paralel pada setiap node komputasi, sehingga sangat meningkatkan efisiensi kueri. Node komputasi adalah unit sumber daya komputasi murni yang dapat dibuat, dihapus, dan diskalakan secara vertikal sesuai permintaan sambil menyediakan penyimpanan SSD lokal dengan kemampuan chaching.

High concurrency support

Dengan berbagi metadata dan penyimpanan data terpadu, HashData secara horizontal memperluas kemampuan komputasi klaster secara bersamaan dengan menambahkan klaster fisik, sekaligus memastikan konsistensi data yang kuat antar klaster.

Mixed load

Dengan memulai cluster sesuai permintaan, HashData dapat memulai cluster independen untuk setiap beban kerja, yang tidak hanya dapat memenuhi kebutuhan berbeda dari beban kerja berbeda untuk konfigurasi node komputasi, tetapi juga memecahkan masalah kinerja yang memengaruhi kinerja karena persaingan sumber daya antara beban kerja yang berbeda.

Expansion in seconds

Menggunakan skema distribusi Hash yang konsisten berdasarkan penyimpanan data bersama untuk menghindari migrasi data node baru

Mengapa Hashdata

Cloud-Native
Architecture

By integrating cloud computing, the architecture achieves separation of storage, computing, and metadata, free from the architectural restrictions and constraints of traditional MPP databases

Multi-dimensional Scalling

Computing and storage resources can be independently scaled according to business needs. The scaling of computing resources can also be performed in two dimensions, horizontal and vertical, according to needs.

High Concurrency Elasticity

Sharing unified metadata and data storage, increasing computing clusters, horizontally scaling the concurrent computing capability of the cluster, removing tranditional MPP concurrency limitation.

Loosely Coupled Applications

The database resources and applications are decoupled, and the computing cluster is flexibly and dynamically allocated according to the workload of the computing cluster and changing application requirements.

Multiple Types of Analyses

GIS and Python components are integrated to the MPP parallel computing architecture, such as SQL analysis, machine learning, and spatiotemporal analysis.

Lake-Warehouse Integration

External tables and connectors makes it possible to manage the ecosystem of enterprise hybrid data and to logically integrate data warehouse and data lake.

Automated
Maintenance

Self-healing and highly available. The cluster can be scaled in seconds. The visual interface of cloud console for monitoring and management minimizes the maintenance complexity and makes it smarter and automated.

Cost
Containment

The pure software solutionis hardware platform agnostic.The cost-effectiv eobject storage provides unlimited scalability, simplifies operation and maintenance, and ensures optimized system construction costs.

Scroll to Top