An Analysis of Database Workload Performance on Simultaneous Multithreaded Processors

Generally speaking, direct assembly coding can outperform the use of intrinsics. Nevertheless, for fairness of comparison with algorithms coded in C,we use the provided intrinsics. Our experimental results use single precision 32-bit float- ing point values as the element data type, unless otherwise mentioned. Since SSE and SSE2 registers are 128 bits, this choice means that S = 4. Our Pentium4 machine runs at GHz, has 1GB of Rambus RDRAM, and uses the RedHat Linux operating system. We use Intel's C++ compiler with the highest optimization level. GNU's g++ compiler gives similar results for algorithms without SIMD instruc- tions, but g++ does not have intrinsics for Pentium SIMD instructions. In this.

Không thể tạo bản xem trước, hãy bấm tải xuống
TỪ KHÓA LIÊN QUAN
TÀI LIỆU MỚI ĐĂNG
24    21    1    30-11-2024
Đã phát hiện trình chặn quảng cáo AdBlock
Trang web này phụ thuộc vào doanh thu từ số lần hiển thị quảng cáo để tồn tại. Vui lòng tắt trình chặn quảng cáo của bạn hoặc tạm dừng tính năng chặn quảng cáo cho trang web này.