@@ -33,7 +33,7 @@ static void dequantize_block_sycl(const void *__restrict__ vx,
33
33
{
34
34
dpct::has_capability_or_fail (stream->get_device (),
35
35
{sycl::aspect::fp16});
36
- syclex::nd_launch (* stream,
36
+ sycl_parallel_for ( stream,
37
37
sycl::nd_range<3 >(
38
38
sycl::range<3 >(1 , 1 , num_blocks) *
39
39
sycl::range<3 >(1 , 1 , SYCL_DEQUANTIZE_BLOCK_SIZE),
@@ -53,7 +53,7 @@ static void dequantize_row_q2_K_sycl(const void *vx, dst_t *y, const int64_t k,
53
53
dpct::has_capability_or_fail (stream->get_device (),
54
54
{sycl::aspect::fp16});
55
55
56
- syclex::nd_launch (* stream,sycl::nd_range<3 >(sycl::range<3 >(1 , 1 , nb) *
56
+ sycl_parallel_for ( stream,sycl::nd_range<3 >(sycl::range<3 >(1 , 1 , nb) *
57
57
sycl::range<3 >(1 , 1 , 64 ),
58
58
sycl::range<3 >(1 , 1 , 64 )),
59
59
[=](sycl::nd_item<3 > item_ct1) {
@@ -65,7 +65,7 @@ static void dequantize_row_q2_K_sycl(const void *vx, dst_t *y, const int64_t k,
65
65
dpct::has_capability_or_fail (stream->get_device (),
66
66
{sycl::aspect::fp16});
67
67
68
- syclex::nd_launch (* stream,sycl::nd_range<3 >(sycl::range<3 >(1 , 1 , nb) *
68
+ sycl_parallel_for ( stream,sycl::nd_range<3 >(sycl::range<3 >(1 , 1 , nb) *
69
69
sycl::range<3 >(1 , 1 , 32 ),
70
70
sycl::range<3 >(1 , 1 , 32 )),
71
71
[=](sycl::nd_item<3 > item_ct1) {
@@ -85,7 +85,7 @@ static void dequantize_row_q3_K_sycl(const void *vx, dst_t *y, const int64_t k,
85
85
dpct::has_capability_or_fail (stream->get_device (),
86
86
{sycl::aspect::fp16});
87
87
88
- syclex::nd_launch (* stream,sycl::nd_range<3 >(sycl::range<3 >(1 , 1 , nb) *
88
+ sycl_parallel_for ( stream,sycl::nd_range<3 >(sycl::range<3 >(1 , 1 , nb) *
89
89
sycl::range<3 >(1 , 1 , 64 ),
90
90
sycl::range<3 >(1 , 1 , 64 )),
91
91
[=](sycl::nd_item<3 > item_ct1) {
@@ -97,7 +97,7 @@ static void dequantize_row_q3_K_sycl(const void *vx, dst_t *y, const int64_t k,
97
97
dpct::has_capability_or_fail (stream->get_device (),
98
98
{sycl::aspect::fp16});
99
99
100
- syclex::nd_launch (* stream,sycl::nd_range<3 >(sycl::range<3 >(1 , 1 , nb) *
100
+ sycl_parallel_for ( stream,sycl::nd_range<3 >(sycl::range<3 >(1 , 1 , nb) *
101
101
sycl::range<3 >(1 , 1 , 32 ),
102
102
sycl::range<3 >(1 , 1 , 32 )),
103
103
[=](sycl::nd_item<3 > item_ct1) {
@@ -116,7 +116,7 @@ static void dequantize_row_q4_0_sycl(const void *vx, dst_t *y, const int64_t k,
116
116
dpct::has_capability_or_fail (stream->get_device (),
117
117
{sycl::aspect::fp16});
118
118
119
- syclex::nd_launch (* stream,sycl::nd_range<3 >(sycl::range<3 >(1 , 1 , nb) *
119
+ sycl_parallel_for ( stream,sycl::nd_range<3 >(sycl::range<3 >(1 , 1 , nb) *
120
120
sycl::range<3 >(1 , 1 , 32 ),
121
121
sycl::range<3 >(1 , 1 , 32 )),
122
122
[=](sycl::nd_item<3 > item_ct1) {
@@ -135,7 +135,7 @@ static void dequantize_row_q4_0_sycl_reorder(const void *vx, dst_t *y, const int
135
135
int constexpr WARP_K = WARP_SIZE * QK4_0;
136
136
const int n_warp = (k + WARP_K - 1 ) / WARP_K;
137
137
GGML_ASSERT (k % 2 == 0 );
138
- syclex::nd_launch (* stream,sycl::nd_range<3 >(sycl::range<3 >(1 , 1 , n_warp) *
138
+ sycl_parallel_for ( stream,sycl::nd_range<3 >(sycl::range<3 >(1 , 1 , n_warp) *
139
139
sycl::range<3 >(1 , 1 , WARP_SIZE),
140
140
sycl::range<3 >(1 , 1 , WARP_SIZE)),
141
141
[=](sycl::nd_item<3 > item_ct1) [[sycl::reqd_sub_group_size (WARP_SIZE)]]{
@@ -153,7 +153,7 @@ static void dequantize_row_q4_1_sycl(const void *vx, dst_t *y, const int64_t k,
153
153
dpct::has_capability_or_fail (stream->get_device (),
154
154
{sycl::aspect::fp16});
155
155
156
- syclex::nd_launch (* stream,sycl::nd_range<3 >(sycl::range<3 >(1 , 1 , nb) *
156
+ sycl_parallel_for ( stream,sycl::nd_range<3 >(sycl::range<3 >(1 , 1 , nb) *
157
157
sycl::range<3 >(1 , 1 , 32 ),
158
158
sycl::range<3 >(1 , 1 , 32 )),
159
159
[=](sycl::nd_item<3 > item_ct1) {
@@ -171,9 +171,9 @@ static void dequantize_row_q4_K_sycl(const void *vx, dst_t *y, const int64_t k,
171
171
dpct::has_capability_or_fail (stream->get_device (),
172
172
{sycl::aspect::fp16});
173
173
174
- syclex::submit (* stream,[&](sycl::handler &cgh) {
174
+ sycl_launch ( stream,[&](sycl::handler &cgh) {
175
175
sycl::local_accessor<uint8_t , 1 > scale_local_acc (sycl::range<1 >(12 ), cgh);
176
- syclex::nd_launch (cgh,sycl::nd_range<3 >(sycl::range<3 >(1 , 1 , nb) *
176
+ sycl_parallel_for (cgh,sycl::nd_range<3 >(sycl::range<3 >(1 , 1 , nb) *
177
177
sycl::range<3 >(1 , 1 , 32 ),
178
178
sycl::range<3 >(1 , 1 , 32 )),
179
179
[=](sycl::nd_item<3 > item_ct1) {
@@ -191,10 +191,10 @@ static void dequantize_row_q4_K_sycl_reorder(const void * vx, dst_t * y, const i
191
191
192
192
dpct::has_capability_or_fail (stream->get_device (), { sycl::aspect::fp16 });
193
193
194
- syclex::submit (* stream,[&](sycl::handler & cgh) {
194
+ sycl_launch ( stream,[&](sycl::handler & cgh) {
195
195
sycl::local_accessor<uint8_t , 1 > scale_local_acc (sycl::range<1 >(12 ), cgh);
196
196
197
- syclex::nd_launch (cgh,sycl::nd_range<1 >(sycl::range<1 >(global_size), sycl::range<1 >(local_size)),
197
+ sycl_parallel_for< 1 > (cgh,sycl::nd_range<1 >(sycl::range<1 >(global_size), sycl::range<1 >(local_size)),
198
198
[=](sycl::nd_item<1 > item_ct1) {
199
199
dequantize_block_q4_K_reorder (vx, y, get_pointer (scale_local_acc), item_ct1, nb);
200
200
});
@@ -210,7 +210,7 @@ static void dequantize_row_q5_K_sycl(const void *vx, dst_t *y, const int64_t k,
210
210
dpct::has_capability_or_fail (stream->get_device (),
211
211
{sycl::aspect::fp16});
212
212
213
- syclex::nd_launch (* stream,sycl::nd_range<3 >(sycl::range<3 >(1 , 1 , nb) *
213
+ sycl_parallel_for ( stream,sycl::nd_range<3 >(sycl::range<3 >(1 , 1 , nb) *
214
214
sycl::range<3 >(1 , 1 , 64 ),
215
215
sycl::range<3 >(1 , 1 , 64 )),
216
216
[=](sycl::nd_item<3 > item_ct1) {
@@ -222,7 +222,7 @@ static void dequantize_row_q5_K_sycl(const void *vx, dst_t *y, const int64_t k,
222
222
dpct::has_capability_or_fail (stream->get_device (),
223
223
{sycl::aspect::fp16});
224
224
225
- syclex::nd_launch (* stream,sycl::nd_range<3 >(sycl::range<3 >(1 , 1 , nb) *
225
+ sycl_parallel_for ( stream,sycl::nd_range<3 >(sycl::range<3 >(1 , 1 , nb) *
226
226
sycl::range<3 >(1 , 1 , 32 ),
227
227
sycl::range<3 >(1 , 1 , 32 )),
228
228
[=](sycl::nd_item<3 > item_ct1) {
@@ -242,7 +242,7 @@ static void dequantize_row_q6_K_sycl(const void *vx, dst_t *y, const int64_t k,
242
242
dpct::has_capability_or_fail (stream->get_device (),
243
243
{sycl::aspect::fp16});
244
244
245
- syclex::nd_launch (* stream,sycl::nd_range<3 >(sycl::range<3 >(1 , 1 , nb) *
245
+ sycl_parallel_for ( stream,sycl::nd_range<3 >(sycl::range<3 >(1 , 1 , nb) *
246
246
sycl::range<3 >(1 , 1 , 64 ),
247
247
sycl::range<3 >(1 , 1 , 64 )),
248
248
[=](sycl::nd_item<3 > item_ct1) {
@@ -254,7 +254,7 @@ static void dequantize_row_q6_K_sycl(const void *vx, dst_t *y, const int64_t k,
254
254
dpct::has_capability_or_fail (stream->get_device (),
255
255
{sycl::aspect::fp16});
256
256
257
- syclex::nd_launch (* stream,sycl::nd_range<3 >(sycl::range<3 >(1 , 1 , nb) *
257
+ sycl_parallel_for ( stream,sycl::nd_range<3 >(sycl::range<3 >(1 , 1 , nb) *
258
258
sycl::range<3 >(1 , 1 , 32 ),
259
259
sycl::range<3 >(1 , 1 , 32 )),
260
260
[=](sycl::nd_item<3 > item_ct1) {
@@ -271,7 +271,7 @@ static void dequantize_row_q6_K_sycl_reorder(const void * vx, dst_t * y, const i
271
271
272
272
dpct::has_capability_or_fail (stream->get_device (), { sycl::aspect::fp16 });
273
273
274
- syclex::nd_launch (* stream,
274
+ sycl_parallel_for ( stream,
275
275
sycl::nd_range<3 >(sycl::range<3 >(1 , 1 , nb) * sycl::range<3 >(1 , 1 , 64 ), sycl::range<3 >(1 , 1 , 64 )),
276
276
[=](sycl::nd_item<3 > item_ct1) { dequantize_block_q6_K_reorder (vx, y, item_ct1, nb); });
277
277
}
@@ -284,8 +284,8 @@ static void dequantize_row_iq1_s_sycl(const void *vx, dst_t *y, const int64_t k,
284
284
dpct::has_capability_or_fail (stream->get_device (),
285
285
{sycl::aspect::fp16});
286
286
287
- syclex::submit (* stream,[&](sycl::handler &cgh) {
288
- syclex::nd_launch (cgh,sycl::nd_range<3 >(sycl::range<3 >(1 , 1 , nb) *
287
+ sycl_launch ( stream,[&](sycl::handler &cgh) {
288
+ sycl_parallel_for (cgh,sycl::nd_range<3 >(sycl::range<3 >(1 , 1 , nb) *
289
289
sycl::range<3 >(1 , 1 , 32 ),
290
290
sycl::range<3 >(1 , 1 , 32 )),
291
291
[=](sycl::nd_item<3 > item_ct1) {
@@ -305,8 +305,8 @@ static void dequantize_row_iq1_m_sycl(const void *vx, dst_t *y, const int64_t k,
305
305
dpct::has_capability_or_fail (stream->get_device (),
306
306
{sycl::aspect::fp16});
307
307
308
- syclex::submit (* stream,[&](sycl::handler &cgh) {
309
- syclex::nd_launch (cgh,sycl::nd_range<3 >(sycl::range<3 >(1 , 1 , nb) *
308
+ sycl_launch ( stream,[&](sycl::handler &cgh) {
309
+ sycl_parallel_for (cgh,sycl::nd_range<3 >(sycl::range<3 >(1 , 1 , nb) *
310
310
sycl::range<3 >(1 , 1 , 32 ),
311
311
sycl::range<3 >(1 , 1 , 32 )),
312
312
[=](sycl::nd_item<3 > item_ct1) {
@@ -326,8 +326,8 @@ static void dequantize_row_iq2_xxs_sycl(const void *vx, dst_t *y, const int64_t
326
326
dpct::has_capability_or_fail (stream->get_device (),
327
327
{sycl::aspect::fp16});
328
328
329
- syclex::submit (* stream,[&](sycl::handler &cgh) {
330
- syclex::nd_launch (cgh,sycl::nd_range<3 >(sycl::range<3 >(1 , 1 , nb) *
329
+ sycl_launch ( stream,[&](sycl::handler &cgh) {
330
+ sycl_parallel_for (cgh,sycl::nd_range<3 >(sycl::range<3 >(1 , 1 , nb) *
331
331
sycl::range<3 >(1 , 1 , 32 ),
332
332
sycl::range<3 >(1 , 1 , 32 )),
333
333
[=](sycl::nd_item<3 > item_ct1) {
@@ -347,8 +347,8 @@ static void dequantize_row_iq2_xs_sycl(const void *vx, dst_t *y, const int64_t k
347
347
dpct::has_capability_or_fail (stream->get_device (),
348
348
{sycl::aspect::fp16});
349
349
350
- syclex::submit (* stream,[&](sycl::handler &cgh) {
351
- syclex::nd_launch (cgh,sycl::nd_range<3 >(sycl::range<3 >(1 , 1 , nb) *
350
+ sycl_launch ( stream,[&](sycl::handler &cgh) {
351
+ sycl_parallel_for (cgh,sycl::nd_range<3 >(sycl::range<3 >(1 , 1 , nb) *
352
352
sycl::range<3 >(1 , 1 , 32 ),
353
353
sycl::range<3 >(1 , 1 , 32 )),
354
354
[=](sycl::nd_item<3 > item_ct1) {
@@ -368,8 +368,8 @@ static void dequantize_row_iq2_s_sycl(const void *vx, dst_t *y, const int64_t k,
368
368
dpct::has_capability_or_fail (stream->get_device (),
369
369
{sycl::aspect::fp16});
370
370
371
- syclex::submit (* stream,[&](sycl::handler &cgh) {
372
- syclex::nd_launch (cgh,sycl::nd_range<3 >(sycl::range<3 >(1 , 1 , nb) *
371
+ sycl_launch ( stream,[&](sycl::handler &cgh) {
372
+ sycl_parallel_for (cgh,sycl::nd_range<3 >(sycl::range<3 >(1 , 1 , nb) *
373
373
sycl::range<3 >(1 , 1 , 32 ),
374
374
sycl::range<3 >(1 , 1 , 32 )),
375
375
[=](sycl::nd_item<3 > item_ct1) {
@@ -388,8 +388,8 @@ static void dequantize_row_iq3_xxs_sycl(const void *vx, dst_t *y, const int64_t
388
388
dpct::has_capability_or_fail (stream->get_device (),
389
389
{sycl::aspect::fp16});
390
390
391
- syclex::submit (* stream,[&](sycl::handler &cgh) {
392
- syclex::nd_launch (cgh,sycl::nd_range<3 >(sycl::range<3 >(1 , 1 , nb) *
391
+ sycl_launch ( stream,[&](sycl::handler &cgh) {
392
+ sycl_parallel_for (cgh,sycl::nd_range<3 >(sycl::range<3 >(1 , 1 , nb) *
393
393
sycl::range<3 >(1 , 1 , 32 ),
394
394
sycl::range<3 >(1 , 1 , 32 )),
395
395
[=](sycl::nd_item<3 > item_ct1) {
@@ -409,8 +409,8 @@ static void dequantize_row_iq3_s_sycl(const void *vx, dst_t *y, const int64_t k,
409
409
dpct::has_capability_or_fail (stream->get_device (),
410
410
{sycl::aspect::fp16});
411
411
412
- syclex::submit (* stream,[&](sycl::handler &cgh) {
413
- syclex::nd_launch (cgh,sycl::nd_range<3 >(sycl::range<3 >(1 , 1 , nb) *
412
+ sycl_launch ( stream,[&](sycl::handler &cgh) {
413
+ sycl_parallel_for (cgh,sycl::nd_range<3 >(sycl::range<3 >(1 , 1 , nb) *
414
414
sycl::range<3 >(1 , 1 , 32 ),
415
415
sycl::range<3 >(1 , 1 , 32 )),
416
416
[=](sycl::nd_item<3 > item_ct1) {
@@ -432,8 +432,8 @@ static void dequantize_row_iq4_xs_sycl(const void *vx, dst_t *y, const int64_t k
432
432
dpct::has_capability_or_fail (stream->get_device (),
433
433
{sycl::aspect::fp16});
434
434
435
- syclex::submit (* stream,[&](sycl::handler &cgh) {
436
- syclex::nd_launch (cgh,
435
+ sycl_launch ( stream,[&](sycl::handler &cgh) {
436
+ sycl_parallel_for (cgh,
437
437
sycl::nd_range<3 >(sycl::range<3 >(1 , 1 , nb) *
438
438
sycl::range<3 >(1 , 1 , 32 ),
439
439
sycl::range<3 >(1 , 1 , 32 )),
@@ -453,8 +453,8 @@ static void dequantize_row_iq4_nl_sycl(const void *vx, dst_t *y, const int64_t k
453
453
dpct::has_capability_or_fail (stream->get_device (),
454
454
{sycl::aspect::fp16});
455
455
456
- syclex::submit (* stream,[&](sycl::handler &cgh) {
457
- syclex::nd_launch (cgh,
456
+ sycl_launch ( stream,[&](sycl::handler &cgh) {
457
+ sycl_parallel_for (cgh,
458
458
sycl::nd_range<3 >(sycl::range<3 >(1 , 1 , nb) *
459
459
sycl::range<3 >(1 , 1 , 32 ),
460
460
sycl::range<3 >(1 , 1 , 32 )),
0 commit comments